物体検出
「D-FINE は、DETR の境界ボックス回帰タスクをFDR として再定義し、GO-LSDを導入する強力なリアルタイム オブジェクト検出器であり、追加の推論およびトレーニング コストを導入することなく優れたパフォーマンスを実現します」とのこと D-FINE味見中https:…
PINTO_model_zooの秋の新作です 人検出+顔向き(水平方向)+属性判定(おとな/こども、男女)+パーツ(目、鼻、口、耳、右手、左手、足)の検出が出来るRT-DETRv2です。この系統のモデルは、PINTO_model_zooでYOLOv9で公開されてきていたのですが、RT-DET…
以下の続きです。 ちょっとymlファイルが多いですが、あまり癖のないトレーニングコードで、サクッとColaboratoryで動かせました RT-DETR(v2)をColaboratoryでトレーニングするサンプルも放流https://t.co/EuKfAaR701 pic.twitter.com/pIk8vY0rCk — 高橋 か…
そーいえば、RT-DETR(v2)触ったことなかったな。と思って軽くお試し あー、CPU(Core i7-8750H CPU)だと思ったより早くて、GPU(GeForce GTX 1050 Ti)だと思ったより遅いな、、、いや、GPU古いってのもありますが、、、新しめのGPUだと速いんだろーなって雰囲…
昔作ったサンプルのフルリニューアルです。 8ヶ月ほど遅いですが、レガシーソリューションから新ソリューションにリニューアルしましたtfliteファイルやtaskファイルをインスタンス生成時にロードする仕様に変わっているやつです。個人的には1枚目のSelfieMu…
Microsoft が 公開している軽量VLMのFlorence 2をColaboratoryで味見しています。 Florence 2 は以下のようなタスクが実行できるモデルです。一般的にVLMで言う、フリーワードでのプロンプトではなく、タスクに応じたプロンプトの指定が必要です。 CAPTION:…
YOLO-World試そう試そうとは思ってたのですが、仕事がバタバタしてて、 今更触りました 気が付いたらv2になっていたわけですが、v1との違いは良く分からないなー 以下の動画の最後のほうの「hand」は頑張っているとは思いますが。 YOLO-Worldもv2になってた…
ちょっと古いモデルなのですが、vehicle-reid-0001(正確には OSNet Ain Vehicle ReID)を動かしました 元はOpenVINO動物園のモデルですね。 と言うか、Vehicle ReIDって、結構な確率でモデルのリンク切れしてたり、パッケージの依存関係がアレすぎて、パッ…
PINTOさんがアノテーション気合入れて、トレーニングされたGold-YOLOです 昨晩つぶやいた無駄に高解像度だった 640x480 から 320x256 にモデルの入力解像度を落として Float32 CPU推論してみた。ほぼ 3.5倍速 になって精度はほとんど落ちなかった。予想外。…
Python東海でLTをしてきました🦔 Pydroid 3で画像処理とかAIを動かすお話です。 ■YouTube ■SpeakerDeck
結構前に作りかけてて、途中で飽きて(使う予定の案件がぽしゃって)放置していたリポジトリです。 整理してGitHubに公開しました ちょっと前に飽きて作るの放置してたDetection→PoseEstimationのリポジトリを掘り起こしてきたYOLOX→RTMPose pic.twitter.com…
TuringさんがOpenLendaと言う信号機検出のモデルを公開されていたので、試してみました HugginFaceでデモが公開されているので、さっと試すことができます。 huggingface.co モデルやPyTorchの推論コードは公式リポジトリで公開されています。 pthモデルの他…
ある意味、以下の投稿の続編ですね。 ただ、YOLOPとYOLOPv2は作者違う? これですね。YOLOPv2 https://t.co/SX7I4dcvD2 pic.twitter.com/0NpGXq8peC — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年7月7日 コードは以下です。 いつものごとく、前処理…
以下のリポジトリのやつです スター数にしては、フォーク数が多く(2023年4月5日時点 310スター 213フォーク)色々な人に使用いただいているのは知っていたのですが、 今回フォーク先を片っ端から覗きにいって、動いたものをまとめました とりあえず、片っ端…
人検出の精度高いやつが欲しくてFreeYOLOのCrowdHumanトレーニングバージョンを試しています CPUでも早くて、小さい対象も検出出来ているし、中々良さそう。 ちょっと別案件の人検出をFreeYOLO(CrowdHuman)に任せようか検討中まあ、添付の動画は無茶なんです…
DAMO-YOLOに引き続き、PINTO さんがツイートしていた FreeYOLOをお試ししています "FreeYOLO - Anchor-free YOLO detector." アンカーフリーなのってYOLOって呼んでいいのかな。ネーミングはもう一切気にしないですけども。「New AP results and weight file…
PP-YOLOE-Plus の 味見 PP-YOLOE-PlusのSの640x640をCPU推論で味見いや、もう正直モデルの良し悪しは、この程度の動画推論くらいじゃ分かりませんね。。。パラメータ数相応の推論速度だとは思うし、ファインチューニングしたとき強いかは分かりませんし。。…
ある意味、以下の続編です。 以下にコミットしています。 いったん公開はしていますが、正直、暫定対応なところとか無理矢理なところとかがちょいちょいあってクオリティはあんまり高くないです。。。 そのうち改善されてくるでしょうけど、、、 暫定対応は2…
PINTO さんがツイートしていた DAMO-YOLO の ONNX推論を試しています もはや何を認識しているのか分からない。凄いのかもしれない。"DAMO-YOLO" pic.twitter.com/62NRc8xqYV — Super PINTO (@PINTO03091) 2022年12月6日 すばらしい。 pic.twitter.com/XxcWEH…
Ogaki Mini Maker Faire 2022 に出展しました 今回は、からあげさんと「AI Zoo Keeper」と言うグループで参加しています。 雑多にAI系のデモを展示する感じです。気合でアレやコレや乗せた感 高橋側の展示物は以下3点です Deep写輪眼 & 写輪眼オーバーレイ (…
YOLOPv2の味見をしています PINTOさんとこのYOLOPv2のONNXモデル(320x192)を味見中v1より確かに精度は良いけど、CPU推論だとモデルサイズ相応の推論速度に見える pic.twitter.com/STuSO203MV — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2022年9月3日 YOL…
FastestDetに興味があるためチョイチョイ試しています FastestDet味見中速度の対して精度高いですね確かに https://t.co/7aUMOMtRVn pic.twitter.com/tSnKpnXfcM — 高橋 かずひと@パワポ職人 (@KzhtTkhs) 2022年7月10日 公式リポジトリの画像でも感じました…
DearPyGuiにノードエディター機能があるのを知って、 ここ一週間くらいノードエディター+画像処理的なツールを作っていました 完全に自分のための仕様で、僕の仕事とかには使える作りにはなっているのですが、 実装済みのノードにはかなり偏りがあります 以…
トラッキング(motpy)付けると流石に重くなる、、、 ギリギリ10fps前後ですね。 「物体検出オンリーですか?」と聞かれたのでトラッキングも付けてみたRaspberry Pi4 CPUオンリーのPerson Trackingはギリギリ10fps前後 https://t.co/TNrgSwJIi0 pic.twitter.c…
Raspberry Pi 4向けの人検出モデルです。 ノートPCとかでも動きますが、ノートPCで動かすくらいならYOLOXとか使ったほうが精度と速度のバランス良いと思います Raspberry Pi4 CPUオンリーのPerson DetectionつづきPINTOさんのTensorflowLite-bin導入するだけ…
Deep写輪眼第3世代です データセットを約3500枚追加し1万枚の大台に乗りました。 そして、YOLOX-Nanoを採用して大幅にスピードアップしています Deep写輪眼v3のモデルトレーニングを行っていますこれはトレーニング途中の味見動画です。第二世代に比べてFPS…
虹彩に写輪眼を重畳表示するプログラムです 結構怖い見た目に、、、 もう少しちゃんと実装いや、怖いな、、、 https://t.co/cGrf9ft5n3 pic.twitter.com/fQkVAW5OOv — 高橋 かずひと@プログラマー定年 (@KzhtTkhs) 2022年4月16日 ソースコードは以下にコミッ…
SAHI(Slicing Aided Hyper Inference) を試してみています 画像を分割して物体検出やインスタンスセグメンテーションを実行し、 推論結果を統合するフレームワークですね。 サンプルの推論試してみる何回も推論して統合する都合上、当たり前ですが相応に推論…
拡張と言うほど大したことはしていませんが、、、※for文ぶん回しただけ ByteTrackのGitHub Issueで Q. マルチクラス対応版はないの?(意訳) A. for文ぶん回せ(意訳) と書いてあったのでfor文ぶん回してマルチクラスにした pic.twitter.com/JJhiy3X5Md — 高橋…
Person ReIdentificationモデルのYoutuReIDを追加しました。 結構早くて性能良さそう お、YoutuReID良いんじゃない? https://t.co/u6q77tpQ0a pic.twitter.com/nxmePQ4ODd — 高橋 かずひと@マリオジェノサイダー (@KzhtTkhs) 2022年2月17日 ソースコードは…