高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

物体検出

YOLO-World-v2 の Gradioデモを Colaboratory上でお試し🦔

YOLO-World試そう試そうとは思ってたのですが、仕事がバタバタしてて、 今更触りました 気が付いたらv2になっていたわけですが、v1との違いは良く分からないなー 以下の動画の最後のほうの「hand」は頑張っているとは思いますが。 YOLO-Worldもv2になってた…

vehicle-reid-0001 お試し👀

ちょっと古いモデルなのですが、vehicle-reid-0001(正確には OSNet Ain Vehicle ReID)を動かしました 元はOpenVINO動物園のモデルですね。 と言うか、Vehicle ReIDって、結構な確率でモデルのリンク切れしてたり、パッケージの依存関係がアレすぎて、パッ…

PINTO_model_zoo:人検出(425_Gold-YOLO-Body-Head-Hand)味見👀

PINTOさんがアノテーション気合入れて、トレーニングされたGold-YOLOです 昨晩つぶやいた無駄に高解像度だった 640x480 から 320x256 にモデルの入力解像度を落として Float32 CPU推論してみた。ほぼ 3.5倍速 になって精度はほとんど落ちなかった。予想外。…

【Python東海#44】Pydroid3で画像処理🦔

Python東海でLTをしてきました🦔 Pydroid 3で画像処理とかAIを動かすお話です。 ■YouTube ■SpeakerDeck

物体検出した結果に対して姿勢推定をする🏃

結構前に作りかけてて、途中で飽きて(使う予定の案件がぽしゃって)放置していたリポジトリです。 整理してGitHubに公開しました ちょっと前に飽きて作るの放置してたDetection→PoseEstimationのリポジトリを掘り起こしてきたYOLOX→RTMPose pic.twitter.com…

OpenLendaで信号機検出をお試し🚥

TuringさんがOpenLendaと言う信号機検出のモデルを公開されていたので、試してみました HugginFaceでデモが公開されているので、さっと試すことができます。 huggingface.co モデルやPyTorchの推論コードは公式リポジトリで公開されています。 pthモデルの他…

YOLOPv2 ONNX推論お試し👀

ある意味、以下の投稿の続編ですね。 ただ、YOLOPとYOLOPv2は作者違う? これですね。YOLOPv2 https://t.co/SX7I4dcvD2 pic.twitter.com/0NpGXq8peC — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年7月7日 コードは以下です。 いつものごとく、前処理…

ハンドキーポイント分類向けModel Zoo🦔

以下のリポジトリのやつです スター数にしては、フォーク数が多く(2023年4月5日時点 310スター 213フォーク)色々な人に使用いただいているのは知っていたのですが、 今回フォーク先を片っ端から覗きにいって、動いたものをまとめました とりあえず、片っ端…

FreeYOLO(CrowdHuman)のお試し👀

人検出の精度高いやつが欲しくてFreeYOLOのCrowdHumanトレーニングバージョンを試しています CPUでも早くて、小さい対象も検出出来ているし、中々良さそう。 ちょっと別案件の人検出をFreeYOLO(CrowdHuman)に任せようか検討中まあ、添付の動画は無茶なんです…

FreeYOLOのONNX推論お試し👀

DAMO-YOLOに引き続き、PINTO さんがツイートしていた FreeYOLOをお試ししています "FreeYOLO - Anchor-free YOLO detector." アンカーフリーなのってYOLOって呼んでいいのかな。ネーミングはもう一切気にしないですけども。「New AP results and weight file…

PINTO_model_zoo:物体検出(336_PP-YOLOE-Plus)デモ追加

PP-YOLOE-Plus の 味見 PP-YOLOE-PlusのSの640x640をCPU推論で味見いや、もう正直モデルの良し悪しは、この程度の動画推論くらいじゃ分かりませんね。。。パラメータ数相応の推論速度だとは思うし、ファインチューニングしたとき強いかは分かりませんし。。…

DAMO-YOLOをColaboratory上でトレーニングするサンプル👻

ある意味、以下の続編です。 以下にコミットしています。 いったん公開はしていますが、正直、暫定対応なところとか無理矢理なところとかがちょいちょいあってクオリティはあんまり高くないです。。。 そのうち改善されてくるでしょうけど、、、 暫定対応は2…

DAMO-YOLOのONNX推論お試し👀

PINTO さんがツイートしていた DAMO-YOLO の ONNX推論を試しています もはや何を認識しているのか分からない。凄いのかもしれない。"DAMO-YOLO" pic.twitter.com/62NRc8xqYV — Super PINTO (@PINTO03091) 2022年12月6日 すばらしい。 pic.twitter.com/XxcWEH…

Ogaki Mini Maker Faire 2022に出展しました🦔

Ogaki Mini Maker Faire 2022 に出展しました 今回は、からあげさんと「AI Zoo Keeper」と言うグループで参加しています。 雑多にAI系のデモを展示する感じです。気合でアレやコレや乗せた感 高橋側の展示物は以下3点です Deep写輪眼 & 写輪眼オーバーレイ (…

PINTO_model_zoo:マルチタスクネットワーク(326_YOLOPv2)デモ追加 ※交通物体検出、道路・ラインセグメンテーション

YOLOPv2の味見をしています PINTOさんとこのYOLOPv2のONNXモデル(320x192)を味見中v1より確かに精度は良いけど、CPU推論だとモデルサイズ相応の推論速度に見える pic.twitter.com/STuSO203MV — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2022年9月3日 YOL…

PINTO_model_zoo:物体検出(308_FastestDet)デモ追加

FastestDetに興味があるためチョイチョイ試しています FastestDet味見中速度の対して精度高いですね確かに https://t.co/7aUMOMtRVn pic.twitter.com/tSnKpnXfcM — 高橋 かずひと@パワポ職人 (@KzhtTkhs) 2022年7月10日 公式リポジトリの画像でも感じました…

ノードエディターベースの画像処理ツールを作りました🦔

DearPyGuiにノードエディター機能があるのを知って、 ここ一週間くらいノードエディター+画像処理的なツールを作っていました 完全に自分のための仕様で、僕の仕事とかには使える作りにはなっているのですが、 実装済みのノードにはかなり偏りがあります 以…

Raspberry Pi 4向けのPerson Tracking(CPU推論4スレッドで85~120ms)

トラッキング(motpy)付けると流石に重くなる、、、 ギリギリ10fps前後ですね。 「物体検出オンリーですか?」と聞かれたのでトラッキングも付けてみたRaspberry Pi4 CPUオンリーのPerson Trackingはギリギリ10fps前後 https://t.co/TNrgSwJIi0 pic.twitter.c…

Raspberry Pi 4向けのPerson Detection(CPU推論4スレッドで45~60ms)

Raspberry Pi 4向けの人検出モデルです。 ノートPCとかでも動きますが、ノートPCで動かすくらいならYOLOXとか使ったほうが精度と速度のバランス良いと思います Raspberry Pi4 CPUオンリーのPerson DetectionつづきPINTOさんのTensorflowLite-bin導入するだけ…

YOLOXでDeep写輪眼

Deep写輪眼第3世代です データセットを約3500枚追加し1万枚の大台に乗りました。 そして、YOLOX-Nanoを採用して大幅にスピードアップしています Deep写輪眼v3のモデルトレーニングを行っていますこれはトレーニング途中の味見動画です。第二世代に比べてFPS…

MedaPipeを用いて虹彩に写輪眼👀

虹彩に写輪眼を重畳表示するプログラムです 結構怖い見た目に、、、 もう少しちゃんと実装いや、怖いな、、、 https://t.co/cGrf9ft5n3 pic.twitter.com/fQkVAW5OOv — 高橋 かずひと@プログラマー定年 (@KzhtTkhs) 2022年4月16日 ソースコードは以下にコミッ…

SAHI(Slicing Aided Hyper Inference) お試し👀

SAHI(Slicing Aided Hyper Inference) を試してみています 画像を分割して物体検出やインスタンスセグメンテーションを実行し、 推論結果を統合するフレームワークですね。 サンプルの推論試してみる何回も推論して統合する都合上、当たり前ですが相応に推論…

ByteTrack マルチクラス拡張🦔

拡張と言うほど大したことはしていませんが、、、※for文ぶん回しただけ ByteTrackのGitHub Issueで Q. マルチクラス対応版はないの?(意訳) A. for文ぶん回せ(意訳) と書いてあったのでfor文ぶん回してマルチクラスにした pic.twitter.com/JJhiy3X5Md — 高橋…

MOT-Tracking-by-Detection-Pipeline に YoutuReID を追加👻

Person ReIdentificationモデルのYoutuReIDを追加しました。 結構早くて性能良さそう お、YoutuReID良いんじゃない? https://t.co/u6q77tpQ0a pic.twitter.com/nxmePQ4ODd — 高橋 かずひと@マリオジェノサイダー (@KzhtTkhs) 2022年2月17日 ソースコードは…

MOT-Tracking-by-Detection-Pipeline に Person ReIdentification を追加👻

Person ReIdentificationを追加しました 場面が切り替わっても、ぼちぼち同一人物と認識しますね。 OpenVINO由来のPerson ReIdentificationを追加しましたONNXモデルはPINTOさんの動物園から https://t.co/gVjv1Iru2Y pic.twitter.com/fIoeLFqr3t — 高橋 か…

MOTのいくつかのアルゴリズム(motpy、ByteTrack、Norfair)とDetection寄せ集め🦔

Tracking-by-Detection系のMOT(Multi Object Tracking)にて、 DetectionとTrackingの処理を分離して寄せ集めたリポジトリを作りました 現時点で対応したモデルやアルゴリズムは以下のような感じです。 Detection YOLOX-Nano EfficientDet-D0 SSD CenterNet N…

YOLOXとByteTrackでMOT(Multi Object Tracking)👀

ByteTrack自体は以前も試してはいるのですが、、、 前のコードだとDetectionとTrackingがイマイチ分離されていなかったので、書き直して試しました この動画のMOT難易度高いんよなー②、、、YOLOX-Nano + ByteTrack https://t.co/d3uuY9KpzW pic.twitter.com/…

YOLOXとmotpyでMOT(Multi Object Tracking)👀

YOLOXとmotpyの組み合わせの事例はチョイチョイ見ますね。 自分でも試してみました この動画のMOT難易度高いんよなー、、、YOLOX-Nano + motpy pic.twitter.com/6msKCHpEF2 — 高橋 かずひと@マリオジェノサイダー (@KzhtTkhs) 2022年2月13日 ソースコードは…

YOLOP ONNX推論お試し👀

YOLOPをお試ししています。 YOLOPはマルチタスクなネットワークで、車両検出、道路セグメンテーション、レーンセグメンテーションの3つのタスクをこなします YOLOPさん。訓練済みモデルが日本の道路と相性悪いのか、いまいちセグメンテーションが不安定な気…

GTSDB(German Traffic Sign Detection Benchmark)でトレーニングされたTraffic Sign Detection👀

いや、ドイツの交通標識データセットなんですけどね、、、 以下は日本の動画なので、クラスIDは当然全然違いますが、検出自体はボチボチしている 結構古めのモデルですが、GTSDB(German Traffic Sign Detection Benchmark)を使った検出モデルがあったので試…