高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

Raspberry Pi4 でPythonパッケージ版MediaPipeの速度確認🦔

PINTOさんとからあげさんのお力によって実現しました。

 

zenn.dev

github.com

7セグメント画像識別🦔

7セグメント識別機を作りました。以下のデータ生成の延長線ですね。

 

 今回は写真データも混ぜて学習させていますが、精度はボチボチですかね🙄

 

ソースコードは以下に🦔

github.com

 

 

【OSC2021 Online Nagoya】Pythonパッケージ版のMediaPipeが超お手軽 (実演デモ版) + MediaPipe Armビルド爆誕

OSC2021 Online Nagoya の Python東海/JuliaTokaiミニ合同勉強会にてLTをしてきました。

Pythontパッケージ版のMediaPipeの紹介とリアルタイムなデモをやるお話です🦔

MediaPipe系のLTでやりたかったことは一通りやったと思うので、いったんこの題材のLTは一区切りする予定です。

speakerdeck.com

 

例のごとくデモ多用しているためYouTubeでの視聴をおススメします🦔

www.youtube.com

 

github.com

 

 

いつもなら、この辺で終わる予定なのですが、、、

今回は更に物語が続きます🦔

きっかけは、からあげさんのこの一言。

 

 

 

 

 

(中略)

(多少の試行錯誤)

 

Ubuntu上で動く報告出る🦔

 

激速で手順公開される🦔

 

RaspberryPi OS(ベータの64bit版)で動作報告出る🦔

 

 

高橋さん寒いネタで驚愕する🦔

 

このツイート通り、目標設定や技術選定を再考する必要が出るのは、また別の話😇

 

ラグナロクオンラインのキャラクターを生成するGAN👾

Lightweight GANを用いてROキャラ画像を生成するGANを訓練しました。

f:id:Kazuhito00:20210513221941g:plain

 

ソースコードは以下に整理してコミットしています。

ONNXへ変換した訓練済みモデルは公開していますが、データセットは当然公開出来ないので、

どれくらいの画像が生成できるようになるのかを確認しただけの自己満リポジトリです👻

Lightweight GANがGPL3のため、念のためGPL3での公開としています。

ただ、訓練済みモデル自体はONNXへ変換しており、推論スクリプトもonnxruntimeで書き下しているため、モデルと推論スクリプトはGPL3を継承しなくても良い気もしますが、、、🤔

これ仕事で同様の状況が発生したら、GPL3に倒すか、それ以外の商用で使いやすいライセンスにするか悩ましいですね、、、(GPLの解釈と倫理的なお話で、、、🤔

7セグメント表示の画像生成ツール👻

7セグメント表示の画像データを生成するツールを作っています。

f:id:Kazuhito00:20210513024036p:plain

 

目的は以下でツイートした通り、リアルデータを用いずに7セグメントの画像識別機を作れないか実験するためです。

 

ソースコードは以下にコミットしています。

github.com

MediaPipe 0.8.4.2でBlazePose GHUM 3Dが追加されました🦔

MediaPipeのPoseとHolisticに3倍正確?なモデルが追加されたようです。

 

精度と速度の異なる3種類のモデル(Lite、Full、Heavy)が追加されたようで、ユースケースに応じて使い分けることが出来そうです。

f:id:Kazuhito00:20210512031728p:plain

 

また、追加に伴い「upper_body_only」オプションが無くなり、「model_complexity」が指定できるようになっています。 デフォルトは1(Full)で、0(Lite)、2(Heavy)で精度と速度のバランスが指定できるようになっています🦔

取り急ぎ、Python版のサンプルで指定できるようにしてみました。

github.com