2022年振り返り

まとめ

はじめに 12/28(水)に仕事納めしました。あとは、だらだらとLT資料作ったり、プログラム作ったり、とあるスタートアップのお手伝いしたり、Axross寄稿原稿書いたりするだけの予定なので、 2022年の振り返りをしたいと思います。思ったより作りたいものあ…

2022-12-31

2022年振り返りその２：Kindle

まとめ Kindle

からあげさんの「Kindleの蔵書情報をKindleアプリのXMLをパースして可視化する方法」です。前回は昨年の12月31日にやっていますね。 Amazon Product Advertising API（商品情報API）追加版ノートブック昨年使用したものを使おうと思っていたのですが、何か…

2022-12-30

2022年振り返りその１：GitHub

まとめ Github

年末と言うことでGitHubリポジトリの振り返りです以下は昨年の投稿。 WORKS.md 今まで作成したリポジトリで対外的に公開しているものは、以下のWORKS.mdに整理して公開しています。 ※画像が多いため転送量注意公開ノートブック PyGitHubを用いたデータ集…

2022-12-26

FreeYOLO(CrowdHuman)のお試し👀

物体検出 ONNX

人検出の精度高いやつが欲しくてFreeYOLOのCrowdHumanトレーニングバージョンを試しています CPUでも早くて、小さい対象も検出出来ているし、中々良さそう。ちょっと別案件の人検出をFreeYOLO(CrowdHuman)に任せようか検討中まあ、添付の動画は無茶なんです…

2022-12-24

Qiita：NiceGUI と OpenCV を組み合わせたい。

Qiita OpenCV

OpenCV Advent Calendar 2022の23日目に投稿しました👻 qiita.com

2022-12-21

Qiita：ノードエディタ形式の画像処理ツール「Image-Processing-Node-Editor」

Qiita OpenCV

OpenCV Advent Calendar 2022の21日目に投稿しました👻 qiita.com

2022-12-13

FreeYOLOのONNX推論お試し👀

物体検出機械学習 ONNX

DAMO-YOLOに引き続き、PINTO さんがツイートしていた FreeYOLOをお試ししています "FreeYOLO - Anchor-free YOLO detector." アンカーフリーなのってYOLOって呼んでいいのかな。ネーミングはもう一切気にしないですけども。「New AP results and weight file…

2022-12-11

PINTO_model_zoo：物体検出（336_PP-YOLOE-Plus）デモ追加

物体検出機械学習 ONNX

PP-YOLOE-Plus の味見 PP-YOLOE-PlusのSの640x640をCPU推論で味見いや、もう正直モデルの良し悪しは、この程度の動画推論くらいじゃ分かりませんね。。。パラメータ数相応の推論速度だとは思うし、ファインチューニングしたとき強いかは分かりませんし。。…

2022-12-10

DAMO-YOLOをColaboratory上でトレーニングするサンプル👻

機械学習物体検出 Colaboratory

ある意味、以下の続編です。以下にコミットしています。いったん公開はしていますが、正直、暫定対応なところとか無理矢理なところとかがちょいちょいあってクオリティはあんまり高くないです。。。そのうち改善されてくるでしょうけど、、、暫定対応は2…

2022-12-10

PINTO_model_zoo：セマンティックセグメンテーション（335_PIDNet）Pythonデモ追加

機械学習 ONNX

早いセマンティックセグメンテーションと噂のPIDNet味見 pidnet_S_cityscapes_544x960 CPUで味見このサイズでこのスピードは速いかしら。少々検出が不安定にも見えますが https://t.co/IgSWP8Bo0H pic.twitter.com/eXvZQBOyNq — 高橋かずひと@闇のパワポLT…

2022-12-07

PINTO_model_zoo：姿勢推定（333_E2Pose）デモ追加

機械学習 ONNX 姿勢推定

E2Pose です複数人の姿勢推定をEnd2Endで実行するモデルですね。 TensorRTでGPU推論するとかなり早い模様です。今回はCPU推論でお試し。 PINTOさん動物園のE2PoseをCPU推論でお試し確認中 pic.twitter.com/V3kyU19EUy — 高橋かずひと@闇のパワポLT職人 (@…

2022-12-07

DAMO-YOLOのONNX推論お試し👀

ONNX 物体検出

PINTO さんがツイートしていた DAMO-YOLO の ONNX推論を試していますもはや何を認識しているのか分からない。凄いのかもしれない。"DAMO-YOLO" pic.twitter.com/62NRc8xqYV — Super PINTO (@PINTO03091) 2022年12月6日すばらしい。 pic.twitter.com/XxcWEH…

2022-12-07

Ogaki Mini Maker Faire 2022に出展しました🦔

機械学習物体検出姿勢推定まとめ OMMF

Ogaki Mini Maker Faire 2022 に出展しました今回は、からあげさんと「AI Zoo Keeper」と言うグループで参加しています。雑多にAI系のデモを展示する感じです。気合でアレやコレや乗せた感高橋側の展示物は以下3点です Deep写輪眼 & 写輪眼オーバーレイ (…

2022-11-14

PINTO_model_zoo：単眼深度推定（210_SC_Depth_pl v3）デモ追加

ONNX

SC Depth pl の v3です。 192x320で、このエッジの取れ具合は凄いな Image-Processing-Node-Editorに取り込もうかしら →(2022/11/15追記) SC Depth pl が GPL v3なので取り込まないおー、CPU推論でこの速度・精度だと、かなり凄いんじゃない？入力サイズは1…

2022-11-06

OpenCVのremap()を用いてメッシュ変形👻

OpenCV

OpenCVのremap()を用いてメッシュ変形的な変換を行うサンプルを作成しました。 OpenCVでメッシュ変形的なやつ。ソースコード整理したぐりぐり動かしてパラメータ保存するスクリプトと、変換だけするスクリプトの2つにした pic.twitter.com/abXthtTMLl — 高橋…

2022-11-05

Pop2PianoでPop音楽ベースのピアノカバー生成お試し👀

機械学習

Pop音楽ベースのピアノカバーのMIDI生成が出来るPop2Pianoの味見をしています。以下のプロジェクトページではいくつかのデモも聞くことが出来ます。公式でColaboratoryのノートブックが提供されているので、それを開いてGPUランタイムで上から実行していけ…

2022-11-01

onnx2tf で高速なTFLiteモデルに変換🏃

ONNX Tensorflow 機械学習 onnx2tf

onnx2tf です。 onnx-tensorflowじゃないです PINTOさんが開発されているツールで、 ONNXファイルをTensorFlow/TensorFlow-Lite形式に変換するツールです。どうもonnx-tensorflowで変換をかけると、無駄に大量のTransposeが挿入される（何か機械的な変換で…

2022-10-23

NiceGUI お試し👀

NiceGUI Python

NiceGUI は、 Pythonベースの UI フレームワークで、Webブラウザで表示するタイプのやつです。 Streamlit は、おまじないが多く、それらを解決するために作成したようです。 JustPyをラッピングする形で実現されているようです（JustPyは低レイヤーの処理が…

2022-10-21

Mubert-Text-to-Music での音楽生成お試し🦔

機械学習

イラスト生成AIが盛り上がったと思ったら、次は音楽生成ですね。進歩のスピードが速くて驚きます。ホントに。お試しした感想は、クオリティは高いけどプロンプトで狙った通りの雰囲気出すの難しいなー。て感じです。そもそもソースコード的には、プロンプ…

2022-10-20

Informative Drawingsでラフスケッチ風イラストへ変換👀

機械学習 Python ONNX GAN

Informative Drawingsの味見をしています。以下のような変換が出来るモデルです。左上：元画像、右上：Anime Style 左下：OpenSketch Style、右下：Countour Style GPUは必要ですが、Webカメラ入力で動作させてみました。それなりに動いていますね Inform…

2022-10-19

Zenn：Pythonの辞書型(dict)でドットアクセス(dot notation)するメモ

Zenn Python

久々のメモ書きです👀 ちょいちょい使いたくなる辞書へのドットアクセスのメモです。

2022-10-13

ONNX Runtime：CUDNN error executing cudnnAddTensor() の処置（2022年10月13現在）

ONNX Python

どこにもメモった形跡が無いので、改めてメモ kazuhito00.hatenablog.com 上記のモデルをONNXでGPU推論しようとすると以下のようなエラーが出ます。 onnxruntime.capi.onnxruntime_pybind11_state.Fail: [ONNXRuntimeError] : 1 : FAIL : Non-zero status co…

2022-09-28

ThinkPad X1 Extreme Gen5購入

雑記

前回ThinkPad X1 Extremeを購入してから約3年と9か月たちました。特に不調とかは無いのですが、そろそろ新しいのが欲しくなったので購入また4年くらいは使えるスペックを。と思いカスタマイズしました。 ThinkPadのカスタマイズモデルは、注文～発送～納品…

2022-09-07

Stable Diffusion img2imgさんに僕を神絵師にしてほしかった🦔

StableDiffusion

世の中にはimg2imgで凄いイラスト作成されている方もいますが、、、流石に「img2img使うだけで貴方も神絵師に」みたいな、そんな甘い世界では無かったです（それはそう長い呪文を使いたくなかったので「pixiv」とか「anime」とか「kawaii」とか入れていま…

2022-09-03

PINTO_model_zoo：マルチタスクネットワーク（326_YOLOPv2）デモ追加 ※交通物体検出、道路・ラインセグメンテーション

物体検出機械学習 Semantic Segmentation

YOLOPv2の味見をしています PINTOさんとこのYOLOPv2のONNXモデル(320x192)を味見中v1より確かに精度は良いけど、CPU推論だとモデルサイズ相応の推論速度に見える pic.twitter.com/STuSO203MV — 高橋かずひと@闇のパワポLT職人 (@KzhtTkhs) 2022年9月3日 YOL…

2022-08-23

ColaboratoryでStable Diffusion触っています👀

StableDiffusion

npakaさんのnoteの「Google Colab ではじめる Stable Diffusion v1.4」を読めばすぐ出来ましたしかし、いきなりM:tGぽいものが出てきてしまった。。。 AIが作ったとはいえ、発表するか否かの判断は人間の責任なので、取り扱いには注意していきたいですね…

2022-08-20

ロイヤリティフリーの360度画像を用意したかった👀

360度画像

基本はロイヤリティフリーの写真と同じなのですが、 360度だと前も後ろも映ってしまうので、映したくないものが入り込む可能性が高い。。。 360度カメラで撮影した風景を著作権フリー素材として公開したい。と思い何に気をつければ良いかを著作権・肖像権・…

2022-08-16

OpenCVでオーディオスペクトラムをはめ込み画像風合成🦔

OpenCV

以下2つの合わせ技ですね👀 動作イメージは以下です。ソースコードは以下です👻

2022-08-15

OpenCVではめ込み画像風合成🦔

OpenCV

はめ込み画像風の合成（四角形のみ）をOpenCVでお試ししています。 OpenCVで雑なはめ込み画像作ってる👀 pic.twitter.com/SQLGlp1zdb — 高橋かずひと@闇のパワポLT職人 (@KzhtTkhs) 2022年8月15日ソースコードは以下に整理してコミットしています🦔

2022-08-14

オーディオスペクトラムとか波形をOpenCVで描画してみる👀

OpenCV

まあタイトルの通りのお遊びで道楽です🦔 オーディオスペクトラムとか波形眺めるの好きなので、無限に見ていられる👀描画はもちろんOpenCVです ※OpenCVの用途外利用 pic.twitter.com/ils9BiIeUw — 高橋かずひと@闇のパワポLT職人 (@KzhtTkhs) 2022年8月9日

高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。　お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

2022-01-01から1年間の記事一覧

2022年振り返り

2022年振り返りその２：Kindle

2022年振り返りその１：GitHub

FreeYOLO(CrowdHuman)のお試し👀

Qiita：NiceGUI と OpenCV を組み合わせたい。

Qiita：ノードエディタ形式の画像処理ツール「Image-Processing-Node-Editor」

FreeYOLOのONNX推論お試し👀

PINTO_model_zoo：物体検出（336_PP-YOLOE-Plus）デモ追加

DAMO-YOLOをColaboratory上でトレーニングするサンプル👻

PINTO_model_zoo：セマンティックセグメンテーション（335_PIDNet）Pythonデモ追加

PINTO_model_zoo：姿勢推定（333_E2Pose）デモ追加

DAMO-YOLOのONNX推論お試し👀

Ogaki Mini Maker Faire 2022に出展しました🦔

PINTO_model_zoo：単眼深度推定（210_SC_Depth_pl v3）デモ追加

OpenCVのremap()を用いてメッシュ変形👻

Pop2PianoでPop音楽ベースのピアノカバー生成お試し👀

onnx2tf で高速なTFLiteモデルに変換🏃

NiceGUI お試し👀

Mubert-Text-to-Music での音楽生成お試し🦔

Informative Drawingsでラフスケッチ風イラストへ変換👀

Zenn：Pythonの辞書型(dict)でドットアクセス(dot notation)するメモ

ONNX Runtime：CUDNN error executing cudnnAddTensor() の処置（2022年10月13現在）

ThinkPad X1 Extreme Gen5購入

Stable Diffusion img2imgさんに僕を神絵師にしてほしかった🦔

PINTO_model_zoo：マルチタスクネットワーク（326_YOLOPv2）デモ追加 ※交通物体検出、道路・ラインセグメンテーション

ColaboratoryでStable Diffusion触っています👀

ロイヤリティフリーの360度画像を用意したかった👀

OpenCVでオーディオスペクトラムをはめ込み画像風合成🦔

OpenCVではめ込み画像風合成🦔

オーディオスペクトラムとか波形をOpenCVで描画してみる👀