高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

ONNX

PINTO_model_zoo:ロードセグメンテーション(136_road-segmentation-adas-0001)Pythonデモ追加

ちょっと用事があってロードセグメンテーション味見中 136_road-segmentation-adas-0001味見中、、、正直精度はボチボチですが、使いたい用途には普通に使えそう pic.twitter.com/TO73D65KpP — 高橋 かずひと@孫請級プログラマー (@KzhtTkhs) 2021年11月23日…

DM-Countで群衆カウントお試し👀

Crowd Counting(群衆カウント、群衆密度推定)の動作を試しています 知り得る限りCrowd Counting系のモデルはGPL3が多いのですが、DM-CountはMITライセンスです。 Crowd Counting(群衆カウント、群衆密度推定)お試し中使いやすいライセンスのモデル少ないなー…

PINTO_model_zoo:超解像(172_Real-Time-Super-Resolution)デモ追加

同解像度だとFast-SRGANのほうが早い? PINTO model zoo No.172:Real-Time-Super-Resolution64x64→256x256の超解像ソレっぽいですが、Fast-SRGANのほうが早かったかしら pic.twitter.com/O6RreGBuDE — 高橋 かずひと@孫請級プログラマー (@KzhtTkhs) 2021年…

ByteTrackをWindowsでお試し👀

ByteTrackはMOT(Multi Object Tracking)のアルゴリズムの一つです。 このアルゴリズムはWindowsで動作しました MOTはDetectionとTrackerとMachingなどの組み合わせで依存関係が激しく、環境構築が大変なことが多いのですが、ByteTrackはWindowsでも動きまし…

PINTO_model_zoo:暗所ノイズ除去(176_StableLLVE)デモ追加 ※Low-Light Image Enhancement

Low-Light Image EnhancementモデルのデモをPINTO_model_zooに追加しました。 しかし、暗闇を見やすくするタスクって「Low-Light Image Enhancement」だと思うのですけど、これ日本語に訳すと何て表現すれば良いの? ONNX試してみました。結構良いかも? htt…

PINTO_model_zoo:単眼深度推定(146_FastDepth、158_HR-Depth)デモ追加

いや、追加したのは少々前なのですが、、、 書き忘れていたので、、、 本当は横長な動画をインプットすると良いのでしょうけど、、、まずはLite-HR-Depth速度の割にエッジとか奥行きがしっかりしている? pic.twitter.com/2LgFv4B7gu — 高橋 かずひと@孫請級…

PyTorch Implementation of AnimeGANv2 お試し その②👀

前回お試ししたプログラムだといまいちなため、 以下の流れで見栄えを調整しました 顔検出→検出領域をAnimeGANv2→セグメンテーションで切り抜いて、元画像に上書き 顔検出してAnimeGANv2かけてセグメンテーションしてみたやつのソースコード整理中 https://t…

PINTO_model_zoo:超解像(171_Fast-SRGAN)お試し🔍

Deep Learningの超解像と言えば、だいたい激重なイメージありますが、、、 Fast-SRGANは中々軽いです 動きました128x128→512x512だとCPU(i7-8750H)で200ms行かないぐらいですね。早いし見た目もそこそこTwitterにあげて動画ガビガビにならないか不安ですが、…

YOLOX-NanoのONNX推論、TFLite推論サンプル

Raspberry Pi4で推論速度を試したくて用意しました YuNetのONNX推論、TFLite推論のリポジトリを何のための用意していたかと言うと、Raspberry Pi4で速度見るためです。YOLOX-Nanoさん、工夫無しでも4FPSくらい出ている https://t.co/ayhjQXDgoT pic.twitter.…

YuNetのONNX推論、TFLite推論サンプル

Raspberry Pi4で推論速度を試したくて用意しました YuNetのONNX推論、TFLite推論のリポジトリを何のための用意していたかと言うと、Raspberry Pi4で速度見るためです。さすがにYuNetさんは早くて工夫無しでも25FPSくらい出ている https://t.co/1TIIFjHXf6 pi…

YOLOXによる物体検出👀

NanoDetの次はYOLOXを試しています。 今回はYOLOX-Nanoの自前データのトレーニングを行いました。 次はYOLOX-Nanoの自前データセットのトレーニング試すかなー pic.twitter.com/Ltl79jFavQ — 高橋 かずひと@孫請級プログラマー (@KzhtTkhs) 2021年9月29日 正…

NanoDetによる物体検出👀

NanoDetは高速・軽量な物体検出モデルです COCO mAP 20.6 で パラメータ数が0.95Mと言う驚異的な軽さです。 2021//9/20時点でGitHubのREADME上に乗っているベンチマークだと以下のような感じです。 流石に精度を求めようと思ったらYOLOシリーズやEfficientDe…

Google MobileObjectLocalizerを用いた物体位置検出

Google MobileObjectLocalizerと言うモデルがTensorFlow-Hubで公開されていたため、試してみました 上記ページによると、以下のような特徴を持つモデルのようです。 MobileObjectLocalizerはクラスに依存しないオブジェクト検出器です。 オブジェクト分類は…

肌、服、髪セグメンテーションお試し🦔

肌、服、髪のセマンティックセグメンテーションモデルを訓練していました。 データセットは自前で、モデルはDeepLabV3+、PAN(Pyramid Attention Networ)、N-Net++です。 pth形式とonnx形式で用意しています。 300枚ほどアノテーションしたので、ちょっと精度…

MoveNetで複数人姿勢推定おためし🦔

試そう試そうと思っていたのですが、ちょっと案件が立て込んでて遅くなりました。 MoveNetの複数人数(最大6名)の姿勢推定です。 処理速度は激速です 精度は以下のような感じ↓ MoveNetのMultiPoseを試していますいや、早いなほんと、、、 pic.twitter.com/kAr…

Axross様への寄稿まとめ(No.01~No.05)

今年に入ってからAxross様に技術記事を寄稿しています。 5つ寄稿し、多少キリが良いのでまとめて紹介しようと思います。 今のところ確定で1本寄稿を予定しており、評判が良ければ追加寄稿をAxross様と相談します。 Axrossとは 以下の理念で運営されているサ…

単一の手のLocalizationモデルお試し作成中。その3。いったん完了。

以下の手検出ですが、いったん、ソースコードを整理して完了です。 お試しで作成出力が分類(無し/グー/パー)×1 と 回帰(X座標、Y座標)×2のLocalizationモデルです。ONNXに変換してCPU推論で動かしています。まあ、正直想定通りですが、、、僕のレベルじゃ、…

単一の手のLocalizationモデルお試し作成中。その2。

以下の続きです。 Raspberry pi4(num_threadsに2を指定)とUnityでの実行を試しています。 Raspberry pi4(num_threadsに2を指定)は以下。 ぼちぼちなのですが、TensorFlow Lite変換後の検出精度がイマイチになったよーな、、、? 60~70msくらい?うーん、、…

Unity Barracuda でリバーシ(教師有り学習モデル)を動かしてみる🦔

TensorFlowでリバーシ用のモデルを教師有り学習で作りました。 せっかくなので、ONNXに変換しUnityのBarracudaで動かしてみています。 TensorFlowにて教師有り学習で作ったリバーシのモデルを、UnityのBarracudaで動かしてみています弱くも強くもないかなー …

Unity BarracudaをWebGL上でお試し🦔

少々、使いどころが出てきそうなので、UnityのBarracuda(ONNXモデルを推論するやつ)を試しています。 タイトルにあるようにWebGLでも動くか試しています いったん案件で使いそうな基礎的なインプット(Webカメラ、動画、手書き)とMNIST、Mobilenet(クラス分…