OpenCV Advent Calendar 2023の10日目の記事です🦔 qiita.com
とりあえず表題の試作品を作りました。 ラズパイと言うかreTerminalですが ※中身はRaspberry Pi CM4 作ったよくあるやつですが、ラズパイで音拾って、インターホンの音だったらLINE通知 https://t.co/xnMJYXqqfS pic.twitter.com/ri0WZ02nTa — 高橋 かずひと…
Qiita の OpenCVアドベントカレンダー6日目の投稿です🦔 qiita.com
ちょっと古いモデルなのですが、vehicle-reid-0001(正確には OSNet Ain Vehicle ReID)を動かしました 元はOpenVINO動物園のモデルですね。 と言うか、Vehicle ReIDって、結構な確率でモデルのリンク切れしてたり、パッケージの依存関係がアレすぎて、パッ…
PINTOさんがアノテーション気合入れて、トレーニングされたGold-YOLOです 昨晩つぶやいた無駄に高解像度だった 640x480 から 320x256 にモデルの入力解像度を落として Float32 CPU推論してみた。ほぼ 3.5倍速 になって精度はほとんど落ちなかった。予想外。…
Python東海でLTをしてきました🦔 Pydroid 3で画像処理とかAIを動かすお話です。 ■YouTube ■SpeakerDeck
GPT4-VのAPIが解放されたため試してみています 手軽に高性能なVLMが扱えるのは良いですね。 GPT4-VのAPIをお試し惜しいけど、日本的なものの理解度もかなり高い pic.twitter.com/6PJyTdyDqO — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年11月7日 GPT…
結構前に作りかけてて、途中で飽きて(使う予定の案件がぽしゃって)放置していたリポジトリです。 整理してGitHubに公開しました ちょっと前に飽きて作るの放置してたDetection→PoseEstimationのリポジトリを掘り起こしてきたYOLOX→RTMPose pic.twitter.com…
TuringさんがOpenLendaと言う信号機検出のモデルを公開されていたので、試してみました HugginFaceでデモが公開されているので、さっと試すことができます。 huggingface.co モデルやPyTorchの推論コードは公式リポジトリで公開されています。 pthモデルの他…
Colab AIが使えるようになってました。 詳しく確認してませんが、有料プランの人のみ使える? あ、ホントやColab AI使えるようになっとる。 pic.twitter.com/3nyRXCVwGu — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年10月7日 右の欄でチャットが出来…
非商用&動画前提なので、個人的には使いどころ無く、あまりしっかりチェックしてませんでしたが、ちょっと味見だけしました 非商用&動画前提なので、個人的には使いどころ無く、あまりしっかりチェックしてませんでしたが、たしかにProPainterさん上手く消し…
大したスクリプトでもないのに大分放置してしまった、、、 こーいうのは、さっさとアウトプットして、サクサク次行かなきゃと思っているのに、寝かせてしまっていました NumPyのmemmap()を使って、OpenCVの画像を他プロセスに受け渡すやつ、大したスクリプト…
Turing様が公開したHeronを試しています TechTalk! も良かったですね 仕事のSlack上では、もっといろいろ試していますが(もちろん外に出せない画像で)、学習済モデルとちょっと+αだけで、色々やりたかったことがお手軽に動きました ちょっとアレやコレや…
夏季休暇シーズンなので、動物園に遊びに行くLTをしてきました🦔 発表資料は以下です。 ちなみに今回のLTの一番大事なところです👻↓ あと、まだ勉強会は未定ですが、リポジトリへの貢献の話とか追加して、ver1.0資料とする予定です👀
以下の投稿の続きです👀 Albumentationsで使うことを想定していたので、そのメモをZennに残しています。
たまーに3次元回転したいことありますよね ネット上に結構サンプルがある処理ですが、データ拡張に使うときに少々カスタマイズが必要だったりしたので、自分の使いやすいものを作成しました。 OpenCVってロール、ピッチ、ヨーの画像回転って無かったっけ?と…
OpenCV4.7かどこかのアップデートで入ったNanoTrackです。 確かアップデート当時に、バグかドキュメントが間違っているか何かでサクッと動作確認できなかったので、放置していたのですが、自分のサンプルリポジトリにプルリクいただいたので確認してみました…
MagicTouch 味見 速度の割に精度良いですね MagicTouch味見さすがに動作早いなー。これCPU推論(Core i7-8750H)です。マウスカーソル当てたところを対象にセグメンテーション https://t.co/SGywr3mL1T pic.twitter.com/TiSvte8Uxd — 高橋 かずひと@闇のパワポ…
霧除去です。雨除去と雪除去の訓練済みの重みも同梱されています 基本的に僕はCPU推論で試そうと思っているのですが、 以下はかなり重かったのでGPU推論(GeForce GTX 1050 Ti)です WGWS-Net 640x480味見おーもーいーなー。除去性能は今までのモデルと有意な…
Image-Processing-Node-Editor のお話しをLTしてきました 僕の中ではImage-Processing-Node-Editor系の発表は年始のNGKで一区切りついていたのですが、1年前のOSC2022でやったLTがどうなったかを報告する意味もこめて、Python東海でLTしてきました。 資料は…
ある意味、以下の投稿の続編ですね。 ただ、YOLOPとYOLOPv2は作者違う? これですね。YOLOPv2 https://t.co/SX7I4dcvD2 pic.twitter.com/0NpGXq8peC — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年7月7日 コードは以下です。 いつものごとく、前処理…
機械学習名古屋がオフライン開催をリブートするということで参加してきました 本編は ChatGPT API を利用した LINE BOTのハンズオンです。 講師対応いただいたミウラさんありがとうございました LT発表も多く、資料は以下のリンクからご確認ください。 私は…
PairLIE味見 あくまで個人的な意見ですが、旧来のモデルに対して特段性能が高い感じはしませんでした。 そして結構処理が重い PairLIEさん補正性能自体はそこそこ(今まで見たモデルと比べて50歩100歩ではある)だけど、処理重いなー。。。512x512のサイズを…
PaddleOCRは、個人的には結構信頼しているOSSのOCRです ちょいちょい案件とかで使ったこともありますが、PaddlePaddle依存なのがちょっと困るケースある感じでした(運用環境には複数の機械学習フレームワークを混在させたくないし。。。) ONNX変換手順は公…
GoogleさんのVisual Blocks for MLを触ってみています 前処理とか、Image⇔Tensorの変換とか、を明示的に行う必要があるので、ガチの初心者や非エンジニアの方には若干難しい気もしますが、そこを分かっている人には手軽で良いツールだと思います。 ノードの…
最近まとめていなかったため、まとめです 以前のまとめは以下です。 kazuhito00.hatenablog.com 寄稿したレシピ 前回まとめたものから追加で10本寄稿しています。 タイトル:MoveNetのキーポイントからボディランゲージを読み取るレシピ ※有料記事 要素技術…
以下で公開されている「colab_utils.py」を利用すると、Colaboratory上で簡易なバウンディングボックスのアノテーションが出来ます。※クラス指定はできない TensorFlowのリポジトリで公開はされていますが、TensorFlow依存無しで利用できます https://github…
以下の投稿の続きです。 LDCでエッジ抽出した後に、OpenCVの細線化アルゴリズムを試してみました。 ■オリジナル画像 ■LDC(Average Image) ■細線化(GUOHALL) ソースコードは以下です。 Colaboratoryで処理が完結します👀
モデル入力の解像度が高ければ、精度はかなり良い感じだと思います 以下は入力サイズ3840x2160のONNXを作って試した例。 ただし、推論は数秒~数十秒かかります。 PINTOさんのツイートで見かけたLDCを味見 1枚目:オリジナル画像 2枚目:5枚出力される結果の…
Lite-Monoは、軽量 CNN と トランスフォーマー を組み合わせた単眼深度推定だそうです 少し動かしてみた感じ、軽さの割に精度が良いと思います。 さっき Explore に出てた単眼深度推定を、CPU推論(Core i7-8750H)で確認速度はボチボチ早くて、精度も結構ディ…