2024-04-24

LLIE系モデルLYT-Netお試し🦔

機械学習 Python ONNX

LLIE（Low-Light Image Enhancement）系モデルのLYT-Netお試しです。
2024年の比較的新しめのモデルです。

比較的新しめのモデルではあるのですが、性能はボチボチふつー、、、
と言うか、いつも試している動画の難易度が高すぎる。と言うのはあると思いますが👻

これは2024年のモデル、LYT-Net👀
毎度LLIE系のお試しで使ってる動画だけど、やはりこれが難易度高すぎるんだよなー🤔 https://t.co/RzKNzJ40MJ pic.twitter.com/Q1lW9a2GSe
— 高橋かずひと@闇のパワポLT職人 (@KzhtTkhs) 2024年4月24日

試したソースコードは以下にコミットしています🦔
いつものとおり、ONNXに変換してから試しています。

github.com

2024-04-24

一人歩きする資料くん👀

雑記

一人歩きする資料くんです👀 pic.twitter.com/KBI4GjqFNB
— 高橋かずひと@闇のパワポLT職人 (@KzhtTkhs) 2024年4月24日

LT資料に載せようと思ってパッと生成した画像ですが、ちょっと気に入った👀

2024-04-20

MeshFlowで動画のブレ補正をお試し🦔

OpenCV Python Colaboratory

最近サルベージしてたブレ補正系の作業はいったんMeshFlowでおしまいです🦔

動画の動きと相性があるのか試したやつだと、あんまり良い見た目になりませんでした。
あとMeshFlowは何ステップかに処理が分かれていて、かなり処理時間かかる👻

MeshFlowというブレ補正を試してた👀
これは多分結構相性あるな、、、🙄 pic.twitter.com/VgzLStLhTH
— 高橋かずひと@闇のパワポLT職人 (@KzhtTkhs) 2024年4月20日

うーーーんーーーー。。。。びみょーーーー、、、👀？ https://t.co/WOiZB5Kzpz pic.twitter.com/J2IsldZ99g
— 高橋かずひと@闇のパワポLT職人 (@KzhtTkhs) 2024年4月20日

Colaboratory上で試したサンプルは以下にコミットしています。

---

処理時間とか精度とかのバランスを考えると、レガシーな画像処理の手法を使ったVidStabのほうが、僕の用途には向いてそう👀

2024-04-18

Keras Code examples 「Keypoint Detection with Transfer Learning」のダメそうなポイントのメモ🦔

Zenn 機械学習 Keras

Keras Code examples の「Keypoint Detection with Transfer Learning」と言うサンプルを改善しようとチマチマ眺めていたけど、無理っぽい気がしたので供養する投稿です🦔

Keras Code examples 結構好きなんですけど、キーポイント検出の内容はずっと気になっているんですよねー…👀

「興味ある」の方ではなく「内容に問題ありそう」って意味での気になる🤔

このサンプル動かしても学習は収束しないし、キーポイント検出も出来ないんだよなー…https://t.co/Bk7VpJaNoz
— 高橋かずひと@闇のパワポLT職人 (@KzhtTkhs) 2024年4月16日

「Keypoint Detection with Transfer Learning」のダメポイントはZennのスクラップにまとめて供養しています。

ダメポイント分かっているなら、それを一つ一つ改善すれば良いんじゃねーの？と思われる方もいると思いますが、、、
Keras Code examples には、以下のような信念があり、それらを満たしつつ改善する方法が思いつきませんでした😇

・コード例は短くする (300 行未満のコード)
・深層学習のワークフローのみに焦点を絞ったシンプルなデモにする
・Google Colaboratoryで実行できるようにする

2024-04-13

GlobalFlowNetで動画のブレ補正をお試し🦔

機械学習 Python Colaboratory

ひとつ前の投稿で書いたVidStabが、いわゆるレガシーな画像処理的なブレ補正だとすると、
GlobalFlowNetは、いわゆるDeep系なブレ補正です。

ブレ補正の性能は高いと思いますが、、、
処理時間がかかるのと、GlobalFlowNetは画像を出力する際に画質が劣化するので、ちょっと僕的には使い道があんまないかなーって感じでした👻

いわゆるDeepなアルゴリズムのVideo Stabilizationも試したけど、後一歩なんだよなー🙄
ブレ抑制の性能は良いんだけど、レガシーな手法に比べて処理時間が爆増するし、画像出力する系のモデルだと画質がイマイチに、、、👀 https://t.co/iTa31bLqbo pic.twitter.com/W8heXcgHv3
— 高橋かずひと@闇のパワポLT職人 (@KzhtTkhs) 2024年4月12日

いったんColaboratory上で試したノートブックは、以下にコミットしています🦔

github.com

2024-04-12

VidStabで動画のブレ補正🐦

Python OpenCV

VidStabというライブラリを使用した動画のブレ補正です。
キーポイントマッチングとアフィン変換を使用した、いわゆるレガシーなブレ補正手法なライブラリです。

Deep系なアルゴリズムに比べて、処理速度が速い傾向があり、そこそこ補正できるような感じです。

以下を見てもらえば分かりますが、ある程度の用途ならば十分に力を発揮するライブラリだと思います🦔

昨日サルベージしたVideo Stabilizationのサンプルを、公開用にコードを整理している👀
VidStab使ってるだけだけど、結構それっぽく動くんだよなー🤔 pic.twitter.com/BNiEtZmjBT
— 高橋かずひと@闇のパワポLT職人 (@KzhtTkhs) 2024年4月12日

各キーポイント抽出手法を比較したコードは、以下にコミットしています👻

github.com

2024-04-11

MobileSAM と EfficientSAM も ONNX推論お試し👀

機械学習 Python ONNX Colaboratory Semantic Segmentation

この投稿の続編です。

kazuhito00.hatenablog.com

MobileSAM と EfficientSAM の ONNX推論お試しコードを以下にコミットしています。
MobileSAMはSAMと同様に、公式リポジトリでエンコーダーのONNXエクスポートが無かったため追加しています。
EfficientSAMは公式リポジトリで、エンコーダー・デコーダーのONNXエクスポート、ONNX推論サンプルがしっかり揃っていたので、Colaboratoryサンプルと他2リポジトリとあわせた簡易デモを用意しています👻

github.com

高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。　お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

LLIE系モデルLYT-Netお試し🦔

一人歩きする資料くん👀

MeshFlowで動画のブレ補正をお試し🦔

Keras Code examples 「Keypoint Detection with Transfer Learning」のダメそうなポイントのメモ🦔

GlobalFlowNetで動画のブレ補正をお試し🦔

VidStabで動画のブレ補正🐦

MobileSAM と EfficientSAM も ONNX推論お試し👀