高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

ONNX

XFeatをONNXに変換してお試し👀

CVPR'24 Paper の XFeatをONNXに変換してお試ししています。いわゆる特徴点抽出ですね 雑にONNXに変換して動かしてみているけど、、、まあ、精度も速度(CPU)も普通かなー、、、 pic.twitter.com/tARe4AQL5e — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) …

LLIE系モデルLYT-Netお試し🦔

LLIE(Low-Light Image Enhancement)系モデルのLYT-Netお試しです。2024年の比較的新しめのモデルです。 比較的新しめのモデルではあるのですが、性能はボチボチふつー、、、と言うか、いつも試している動画の難易度が高すぎる。と言うのはあると思いますが…

MobileSAM と EfficientSAM も ONNX推論お試し👀

この投稿の続編です。 kazuhito00.hatenablog.com MobileSAM と EfficientSAM の ONNX推論お試しコードを以下にコミットしています。MobileSAMはSAMと同様に、公式リポジトリでエンコーダーのONNXエクスポートが無かったため追加しています。EfficientSAMは…

Segment Anything Model(SAM)をONNXに変換して推論🦔

本当はもっと早くやりたかったシリーズSAMが登場してから、もう1年たってるんですよね。。。 SAMは凄い良いモデルなのですが、、、公式リポジトリのONNXエクスポートとONNX推論周りのサポートはちょっとイマイチだと思っています。 どれくらいイマイチかと言…

vehicle-reid-0001 お試し👀

ちょっと古いモデルなのですが、vehicle-reid-0001(正確には OSNet Ain Vehicle ReID)を動かしました 元はOpenVINO動物園のモデルですね。 と言うか、Vehicle ReIDって、結構な確率でモデルのリンク切れしてたり、パッケージの依存関係がアレすぎて、パッ…

PINTO_model_zoo:人検出(425_Gold-YOLO-Body-Head-Hand)味見👀

PINTOさんがアノテーション気合入れて、トレーニングされたGold-YOLOです 昨晩つぶやいた無駄に高解像度だった 640x480 から 320x256 にモデルの入力解像度を落として Float32 CPU推論してみた。ほぼ 3.5倍速 になって精度はほとんど落ちなかった。予想外。…

PINTO_model_zoo:インタラクティブセグメンテーション(391_MagicTouch)Pythonデモ追加

MagicTouch 味見 速度の割に精度良いですね MagicTouch味見さすがに動作早いなー。これCPU推論(Core i7-8750H)です。マウスカーソル当てたところを対象にセグメンテーション https://t.co/SGywr3mL1T pic.twitter.com/TiSvte8Uxd — 高橋 かずひと@闇のパワポ…

PINTO_model_zoo:霧除去・雨除去・雪除去(389_WGWS-Net)Pythonデモ追加

霧除去です。雨除去と雪除去の訓練済みの重みも同梱されています 基本的に僕はCPU推論で試そうと思っているのですが、 以下はかなり重かったのでGPU推論(GeForce GTX 1050 Ti)です WGWS-Net 640x480味見おーもーいーなー。除去性能は今までのモデルと有意な…

YOLOPv2 ONNX推論お試し👀

ある意味、以下の投稿の続編ですね。 ただ、YOLOPとYOLOPv2は作者違う? これですね。YOLOPv2 https://t.co/SX7I4dcvD2 pic.twitter.com/0NpGXq8peC — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年7月7日 コードは以下です。 いつものごとく、前処理…

PINTO_model_zoo:暗所ノイズ除去(385_PairLIE)Pythonデモ追加

PairLIE味見 あくまで個人的な意見ですが、旧来のモデルに対して特段性能が高い感じはしませんでした。 そして結構処理が重い PairLIEさん補正性能自体はそこそこ(今まで見たモデルと比べて50歩100歩ではある)だけど、処理重いなー。。。512x512のサイズを…

LDC + 細線化アルゴリズム をお試し👻

以下の投稿の続きです。 LDCでエッジ抽出した後に、OpenCVの細線化アルゴリズムを試してみました。 ■オリジナル画像 ■LDC(Average Image) ■細線化(GUOHALL) ソースコードは以下です。 Colaboratoryで処理が完結します👀

LDC: Lightweight Dense CNN for Edge Detection(線画抽出) を ONNX に変換して味見👀

モデル入力の解像度が高ければ、精度はかなり良い感じだと思います 以下は入力サイズ3840x2160のONNXを作って試した例。 ただし、推論は数秒~数十秒かかります。 PINTOさんのツイートで見かけたLDCを味見 1枚目:オリジナル画像 2枚目:5枚出力される結果の…

単眼深度推定 Lite-Mono を ONNX に変換して味見👀

Lite-Monoは、軽量 CNN と トランスフォーマー を組み合わせた単眼深度推定だそうです 少し動かしてみた感じ、軽さの割に精度が良いと思います。 さっき Explore に出てた単眼深度推定を、CPU推論(Core i7-8750H)で確認速度はボチボチ早くて、精度も結構ディ…

暗所ノイズ除去モデル FLW-Net を ONNX や TFLite(onnx2tf使用)に変換して動作確認👀

正直LLIEはデータセットの問題なのか、どのモデルも一長一短な感じがしますね。 FLW-Net 動作確認 & 速度比較320x240サイズで i7 CPUです。左からONNX、TFLite(num_threads=1)、TFLite(num_threads=4) で、TFLiteへ変換するツールはonnx2tfです pic.twitter.…

PINTO_model_zoo:背景除去(353_ShadowFormer)Pythonデモ追加

影除去モデルのShadowFormerの味見です マスク画像がちゃんとしていると結構綺麗に影が消えます。 処理時間はかなり重め。 まあ、入力画像の他にマスク画像も必要ですし、リアルタイム前提ではないですね。 ShadowFormerもっかい味見気合入れてマスク画像作…

背景除去(DIS)の isnet-general-useモデルの性能をお試し👀

以下の投稿の続編です。 isnet-general-use.pth モデルのほうが強い? 髪と腕の間も切り抜けているようですね。 pic.twitter.com/zzFpH7SltZ — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年2月25日 isnet-general-use.pth ってアップデートで追加さ…

PINTO_model_zoo:背景除去(313_IS-Net)Pythonデモ追加

背景除去のIS-Netの味見です アップデート版のモデルがオリジナルリポジトリに更新されているようなので、後で見に行きます。 PINTOさん動物園からIS-Net拾ってきて味見背景削除さん pic.twitter.com/JMtuYc3gwG — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkh…

PINTO_model_zoo:擬態検出(299_DGNet)Pythonデモ追加

擬態物体検出の味見です 擬態動画で良いのが中々見つからないなー。 昆虫とか色々試してみたい DGNet味見Camouflaged Object Detection(擬態物体検出)です pic.twitter.com/98xJKnszrU — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年2月24日 デモコー…

PINTO_model_zoo:霧除去(325_DehazeFormer)Pythonデモ追加

DehazeFormer味見 もしかしたら前処理か後処理間違っているかも? ちょっと補正が弱すぎる気がする DehazeFormerうーん、、、?何か間違えたか?霧除去能力こんな低くないよな? pic.twitter.com/2Xx66m3zLR — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2…

PINTO_model_zoo:ブラー除去(323_Stripformer)Pythonデモ追加

ブラー除去のStripformerさん味見 ブラー除去のモデルはどれも重いなーーー。軽いのどっかに無いかなーーー。 Stripformerさん、名前と重みのサイズから予想はしていたけど、、、処理が重いなー320x240のサイズでも、しょぼGPU(GeForce GTX 1050 Ti)推論じゃ…

PINTO_model_zoo:単眼深度推定(314_PyDNet2)デモ追加

PyDNet2を味見中 最近、単眼深度推定を触っていませんでしたが、たぶん早い。 もう半年以上前のコミットじゃったか、、、PyDNet2味見pydnet2_192x512 の CPU推論です。 https://t.co/bZ7mSPinrc pic.twitter.com/s0Fl7YyQ3F — 高橋 かずひと@闇のパワポLT職…

PINTO_model_zoo:超解像(351_RFDN)Pythonデモ追加

久々に超解像の味見です ちょっと間が空いてしまいましたが、、、RFDNを味見CPU推論で160x120→640x480の超解像がこの速度ならかなり早いんじゃない? https://t.co/WHsJyG2StK pic.twitter.com/pxcq0LKaHW — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 202…

暗所ノイズ除去(SCI)の3種モデル(easy、medium、difficult)をお試し👀

以下の投稿をした後、1ヶ月後くらいにオリジナルリポジトリのほうで、リファクタリングがあったぽく、モデル種類が3種(easy、medium、difficult)に増えていたので確認してみました。 ただ、あんまり違いは分からないですね。 動画との相性もあるかもですが、…

PINTO_model_zoo:暗所ノイズ除去(348_Bread)Pythonデモ追加 + γ値とStrength指定デモ

以前取り扱ったLLIE系のモデルに比べると若干重い感じはしますが、、、 補正性能や昼間での暴れなさは中々性能が高いように見えます BreadさんをとりあえずONNXに変換して味見入力画像の他にgammaとstrengthを受け取るモデルです https://t.co/LaAprGMmfY pi…

PINTO_model_zoo:人物属性判定(124_person-attributes-recognition-crossroad-0230 ~ 126_person-attributes-recognition-crossroad-0238)デモ追加

人物の属性判定を試しています まあ、正直当たったり当たらなかったりと言うか、、、 トレーニングに使われたデータセットが十中八九日本人じゃないので、精度もイマイチと言うか 属性によっては精度は多少信頼しても良さそうですが 属性判定あってるよーな…

FreeYOLO(CrowdHuman)のお試し👀

人検出の精度高いやつが欲しくてFreeYOLOのCrowdHumanトレーニングバージョンを試しています CPUでも早くて、小さい対象も検出出来ているし、中々良さそう。 ちょっと別案件の人検出をFreeYOLO(CrowdHuman)に任せようか検討中まあ、添付の動画は無茶なんです…

FreeYOLOのONNX推論お試し👀

DAMO-YOLOに引き続き、PINTO さんがツイートしていた FreeYOLOをお試ししています "FreeYOLO - Anchor-free YOLO detector." アンカーフリーなのってYOLOって呼んでいいのかな。ネーミングはもう一切気にしないですけども。「New AP results and weight file…

PINTO_model_zoo:物体検出(336_PP-YOLOE-Plus)デモ追加

PP-YOLOE-Plus の 味見 PP-YOLOE-PlusのSの640x640をCPU推論で味見いや、もう正直モデルの良し悪しは、この程度の動画推論くらいじゃ分かりませんね。。。パラメータ数相応の推論速度だとは思うし、ファインチューニングしたとき強いかは分かりませんし。。…

PINTO_model_zoo:セマンティックセグメンテーション(335_PIDNet)Pythonデモ追加

早いセマンティックセグメンテーションと噂のPIDNet味見 pidnet_S_cityscapes_544x960 CPUで味見このサイズでこのスピードは速いかしら。少々検出が不安定にも見えますが https://t.co/IgSWP8Bo0H pic.twitter.com/eXvZQBOyNq — 高橋 かずひと@闇のパワポLT…

PINTO_model_zoo:姿勢推定(333_E2Pose)デモ追加

E2Pose です 複数人の姿勢推定をEnd2Endで実行するモデルですね。 TensorRTでGPU推論するとかなり早い模様です。 今回はCPU推論でお試し。 PINTOさん動物園のE2PoseをCPU推論でお試し確認中 pic.twitter.com/V3kyU19EUy — 高橋 かずひと@闇のパワポLT職人 (@…