高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

機械学習

LLIE系モデルLYT-Netお試し🦔

LLIE(Low-Light Image Enhancement)系モデルのLYT-Netお試しです。2024年の比較的新しめのモデルです。 比較的新しめのモデルではあるのですが、性能はボチボチふつー、、、と言うか、いつも試している動画の難易度が高すぎる。と言うのはあると思いますが…

Keras Code examples 「Keypoint Detection with Transfer Learning」のダメそうなポイントのメモ🦔

Keras Code examples の「Keypoint Detection with Transfer Learning」と言うサンプルを改善しようとチマチマ眺めていたけど、無理っぽい気がしたので供養する投稿です Keras Code examples 結構好きなんですけど、キーポイント検出の内容はずっと気になっ…

GlobalFlowNetで動画のブレ補正をお試し🦔

ひとつ前の投稿で書いたVidStabが、いわゆるレガシーな画像処理的なブレ補正だとすると、GlobalFlowNetは、いわゆるDeep系なブレ補正です。 ブレ補正の性能は高いと思いますが、、、処理時間がかかるのと、GlobalFlowNetは画像を出力する際に画質が劣化する…

MobileSAM と EfficientSAM も ONNX推論お試し👀

この投稿の続編です。 kazuhito00.hatenablog.com MobileSAM と EfficientSAM の ONNX推論お試しコードを以下にコミットしています。MobileSAMはSAMと同様に、公式リポジトリでエンコーダーのONNXエクスポートが無かったため追加しています。EfficientSAMは…

Segment Anything Model(SAM)をONNXに変換して推論🦔

本当はもっと早くやりたかったシリーズSAMが登場してから、もう1年たってるんですよね。。。 SAMは凄い良いモデルなのですが、、、公式リポジトリのONNXエクスポートとONNX推論周りのサポートはちょっとイマイチだと思っています。 どれくらいイマイチかと言…

heron-blip-v1 を Colab で試してから2週間たっている、、、ですって、、、👀

仕事バタバタしてて、あっという間に2週間たってた、、、 v0に比べて性能が結構上がっている感あったのですが、、、 比較結果どっかなくしてしまった。。。 heron-blip-v1味見してる良い感じ https://t.co/Vs1Iy5TwJR pic.twitter.com/dui1kDfrGt — 高橋 か…

試作:ラズパイで音拾ってインターホンの音だったらLINE通知🦔

とりあえず表題の試作品を作りました。 ラズパイと言うかreTerminalですが ※中身はRaspberry Pi CM4 作ったよくあるやつですが、ラズパイで音拾って、インターホンの音だったらLINE通知 https://t.co/xnMJYXqqfS pic.twitter.com/ri0WZ02nTa — 高橋 かずひと…

vehicle-reid-0001 お試し👀

ちょっと古いモデルなのですが、vehicle-reid-0001(正確には OSNet Ain Vehicle ReID)を動かしました 元はOpenVINO動物園のモデルですね。 と言うか、Vehicle ReIDって、結構な確率でモデルのリンク切れしてたり、パッケージの依存関係がアレすぎて、パッ…

PINTO_model_zoo:人検出(425_Gold-YOLO-Body-Head-Hand)味見👀

PINTOさんがアノテーション気合入れて、トレーニングされたGold-YOLOです 昨晩つぶやいた無駄に高解像度だった 640x480 から 320x256 にモデルの入力解像度を落として Float32 CPU推論してみた。ほぼ 3.5倍速 になって精度はほとんど落ちなかった。予想外。…

【Python東海#44】Pydroid3で画像処理🦔

Python東海でLTをしてきました🦔 Pydroid 3で画像処理とかAIを動かすお話です。 ■YouTube ■SpeakerDeck

gpt-4-vision-preview をお試し👻

GPT4-VのAPIが解放されたため試してみています 手軽に高性能なVLMが扱えるのは良いですね。 GPT4-VのAPIをお試し惜しいけど、日本的なものの理解度もかなり高い pic.twitter.com/6PJyTdyDqO — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年11月7日 GPT…

物体検出した結果に対して姿勢推定をする🏃

結構前に作りかけてて、途中で飽きて(使う予定の案件がぽしゃって)放置していたリポジトリです。 整理してGitHubに公開しました ちょっと前に飽きて作るの放置してたDetection→PoseEstimationのリポジトリを掘り起こしてきたYOLOX→RTMPose pic.twitter.com…

OpenLendaで信号機検出をお試し🚥

TuringさんがOpenLendaと言う信号機検出のモデルを公開されていたので、試してみました HugginFaceでデモが公開されているので、さっと試すことができます。 huggingface.co モデルやPyTorchの推論コードは公式リポジトリで公開されています。 pthモデルの他…

Colab AIお試し👀

Colab AIが使えるようになってました。 詳しく確認してませんが、有料プランの人のみ使える? あ、ホントやColab AI使えるようになっとる。 pic.twitter.com/3nyRXCVwGu — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年10月7日 右の欄でチャットが出来…

ProPainter(Image Inpainting)お試し👀

非商用&動画前提なので、個人的には使いどころ無く、あまりしっかりチェックしてませんでしたが、ちょっと味見だけしました 非商用&動画前提なので、個人的には使いどころ無く、あまりしっかりチェックしてませんでしたが、たしかにProPainterさん上手く消し…

Heronの学習済モデルをお試し🦔

Turing様が公開したHeronを試しています TechTalk! も良かったですね 仕事のSlack上では、もっといろいろ試していますが(もちろん外に出せない画像で)、学習済モデルとちょっと+αだけで、色々やりたかったことがお手軽に動きました ちょっとアレやコレや…

【Unagi.py 56枚目】動物園(PINTO_model_zoo)に遊びに行こう🦔

夏季休暇シーズンなので、動物園に遊びに行くLTをしてきました🦔 発表資料は以下です。 ちなみに今回のLTの一番大事なところです👻↓ あと、まだ勉強会は未定ですが、リポジトリへの貢献の話とか追加して、ver1.0資料とする予定です👀

OpenCVのNanoTrackを動作確認👀

OpenCV4.7かどこかのアップデートで入ったNanoTrackです。 確かアップデート当時に、バグかドキュメントが間違っているか何かでサクッと動作確認できなかったので、放置していたのですが、自分のサンプルリポジトリにプルリクいただいたので確認してみました…

PINTO_model_zoo:インタラクティブセグメンテーション(391_MagicTouch)Pythonデモ追加

MagicTouch 味見 速度の割に精度良いですね MagicTouch味見さすがに動作早いなー。これCPU推論(Core i7-8750H)です。マウスカーソル当てたところを対象にセグメンテーション https://t.co/SGywr3mL1T pic.twitter.com/TiSvte8Uxd — 高橋 かずひと@闇のパワポ…

PINTO_model_zoo:霧除去・雨除去・雪除去(389_WGWS-Net)Pythonデモ追加

霧除去です。雨除去と雪除去の訓練済みの重みも同梱されています 基本的に僕はCPU推論で試そうと思っているのですが、 以下はかなり重かったのでGPU推論(GeForce GTX 1050 Ti)です WGWS-Net 640x480味見おーもーいーなー。除去性能は今までのモデルと有意な…

【機械学習名古屋 2023/06/24】Visual Blocks for ML

機械学習名古屋がオフライン開催をリブートするということで参加してきました 本編は ChatGPT API を利用した LINE BOTのハンズオンです。 講師対応いただいたミウラさんありがとうございました LT発表も多く、資料は以下のリンクからご確認ください。 私は…

PINTO_model_zoo:暗所ノイズ除去(385_PairLIE)Pythonデモ追加

PairLIE味見 あくまで個人的な意見ですが、旧来のモデルに対して特段性能が高い感じはしませんでした。 そして結構処理が重い PairLIEさん補正性能自体はそこそこ(今まで見たモデルと比べて50歩100歩ではある)だけど、処理重いなー。。。512x512のサイズを…

PaddleOCRをONNXに変換してお試し🦔

PaddleOCRは、個人的には結構信頼しているOSSのOCRです ちょいちょい案件とかで使ったこともありますが、PaddlePaddle依存なのがちょっと困るケースある感じでした(運用環境には複数の機械学習フレームワークを混在させたくないし。。。) ONNX変換手順は公…

LDC + 細線化アルゴリズム をお試し👻

以下の投稿の続きです。 LDCでエッジ抽出した後に、OpenCVの細線化アルゴリズムを試してみました。 ■オリジナル画像 ■LDC(Average Image) ■細線化(GUOHALL) ソースコードは以下です。 Colaboratoryで処理が完結します👀

LDC: Lightweight Dense CNN for Edge Detection(線画抽出) を ONNX に変換して味見👀

モデル入力の解像度が高ければ、精度はかなり良い感じだと思います 以下は入力サイズ3840x2160のONNXを作って試した例。 ただし、推論は数秒~数十秒かかります。 PINTOさんのツイートで見かけたLDCを味見 1枚目:オリジナル画像 2枚目:5枚出力される結果の…

単眼深度推定 Lite-Mono を ONNX に変換して味見👀

Lite-Monoは、軽量 CNN と トランスフォーマー を組み合わせた単眼深度推定だそうです 少し動かしてみた感じ、軽さの割に精度が良いと思います。 さっき Explore に出てた単眼深度推定を、CPU推論(Core i7-8750H)で確認速度はボチボチ早くて、精度も結構ディ…

暗所ノイズ除去モデル FLW-Net を ONNX や TFLite(onnx2tf使用)に変換して動作確認👀

正直LLIEはデータセットの問題なのか、どのモデルも一長一短な感じがしますね。 FLW-Net 動作確認 & 速度比較320x240サイズで i7 CPUです。左からONNX、TFLite(num_threads=1)、TFLite(num_threads=4) で、TFLiteへ変換するツールはonnx2tfです pic.twitter.…

ハンドキーポイント分類向けModel Zoo🦔

以下のリポジトリのやつです スター数にしては、フォーク数が多く(2023年4月5日時点 310スター 213フォーク)色々な人に使用いただいているのは知っていたのですが、 今回フォーク先を片っ端から覗きにいって、動いたものをまとめました とりあえず、片っ端…

参考資料:Mobility Technologies (MoT) さんの発表資料いろいろ

Twitterのブックマークに放り込んでいたのですが、、、Twitterのブックマークって、あっと言う間に流れていき、見たくなった時に、いつも探し回るので、こちらにメモ もう結構古い資料も混ざっていますが、今でも勉強になる資料がいっぱいです。 あと、MoTさ…

参考資料:機械学習の社会実装とか失敗とか

Twitterのブックマークに放り込んでいたのですが、、、Twitterのブックマークって、あっと言う間に流れていき、見たくなった時に、いつも探し回るので、こちらにメモ👀 失敗から学ぶ機械学習応用 from Hiroyuki Masuda