DEIMv2 の ONNX変換と Colaboratory上でのトレーニング👀

機械学習物体検出 Python ONNX Colaboratory

性能が良い物体検出モデルDEIMのv2です。個人的には以下の表のとおり、AttoやFemto、Picoなど超軽量系のラインナップがあるのが凄く好みです直近で使う予定はないのですが、使いたくなった時にすぐ使えるように、いつも通りONNX変換とColaboratory上でのト…

2025-10-07

音声強調モデル LiSenNet をONNXに変換🦔

機械学習 Python ONNX DSP

入力した音声のノイズ低減と音声強調を行うモデルです。軽量を謳っているモデルなのですが、Griffin-Limアルゴリズム（反復処理 & 出力チャンクより未来のデータが必要）を採用しているため、僕が使いたい用途では使いにくいため、リポジトリ公開して供養👻 g…

2025-10-02

音声復元モデル VoiceFixer をONNXに変換🦔

機械学習 Python ONNX DSP

劣化した音声をデノイズした上で、復元するモデルです。僕の使いたい用途には重すぎて、使い道がなくなってしまったので、リポジトリ公開して供養ちょっと古いモデルですが、精度は結構良いと思います供養供養ONNX変換したけど、僕の使いたい用途には重す…

2025-09-07

PINTO_model_zoo：インスタンスセグメンテーション（470_RHIS）味見👀

機械学習 Python ONNX Semantic Segmentation

インスタンスセグメンテーションです。特徴的な構造として、このモデルには物体検出部分は含まれないため、自分の好きな物体検出モデルの検出結果と組み合わせて使用します。そのため、このモデルの入力は、画像とROIの2入力ですセグメンテーション結果は…

2025-05-26

ナンバープレート検出と認識ＡＩのプロトタイプ🚙

物体検出機械学習 Python ONNX

タイトルにプロトタイプとありますが、永遠に正式版は作られません（たぶん YOLOの新し目のやつを試してみたかったのと、ChatGPTにモデル構造作らせてみたかったのと、でテキトーに作ったリポジトリです検出用のデータセットは高橋宅周辺、認識用のデータセ…

2025-05-10

ノードエディターベースのオーディオ処理ツールを作りました🦔

Python DSP ONNX 機械学習 Audio-Processing-Node-Editor APN-Editor

以下のリポジトリで公開しています。名前は安直に「Audio-Processing-Node-Editor」としましたちなみに、これ↓のオーディオ版です。ちょっと仕事で音声処理を触ることがあって、たまたまGWの休み前後だったので、Image-Processing-Node-Editorベースでザッ…

2025-05-08

Speech Enhancement（音声強調）モデルGTCRNお試し🎤

DSP 信号処理 Python Colaboratory ONNX

1X年くらい音声信号処理から離れていましたが、最近触る機会があったため、ちょこちょこ色々なモデルとかアルゴリズムを味見しています今回は、新しめ（ICASSP2024）のSpeech Enhancement（音声強調）モデルのGTCRNです。この分野だとRNNoiseとかDeepFilter…

2025-03-02

DEIM（高速収束のためのマッチングを改善した DETR）をColaboratoryで実行👀

Python ONNX 物体検出 Colaboratory

DEIMは、RT-DETR-v2とD-FINEについて、より高速な収束と精度の向上を可能にするように設計された高度なトレーニングフレームワークです👀 いつものようにColaboratoryでトレーニングして、ONNX推論するサンプルを作りました🦔 github.com

2024-10-27

RT-DETRの改良モデル？ D-FINEをお試し🦔

物体検出 ONNX Colaboratory

「D-FINE は、DETR の境界ボックス回帰タスクをFDR として再定義し、GO-LSDを導入する強力なリアルタイムオブジェクト検出器であり、追加の推論およびトレーニングコストを導入することなく優れたパフォーマンスを実現します」とのこと D-FINE味見中https:…

2024-10-17

PINTO_model_zoo：人検出＋顔向き＋属性判定＋パーツ検出モデル（460_RT-DETRv2-Wholebody25）味見👀

機械学習物体検出 ONNX

PINTO_model_zooの秋の新作です人検出＋顔向き（水平方向）＋属性判定（おとな/こども、男女）＋パーツ（目、鼻、口、耳、右手、左手、足）の検出が出来るRT-DETRv2です。この系統のモデルは、PINTO_model_zooでYOLOv9で公開されてきていたのですが、RT-DET…

2024-10-12

RT-DETR(v2) を Colaboratoryでトレーニングするサンプル👻

物体検出 ONNX Colaboratory

以下の続きです。ちょっとymlファイルが多いですが、あまり癖のないトレーニングコードで、サクッとColaboratoryで動かせました RT-DETR(v2)をColaboratoryでトレーニングするサンプルも放流https://t.co/EuKfAaR701 pic.twitter.com/pIk8vY0rCk — 高橋か…

2024-10-12

RT-DETR(v2) を ONNX推論おためし👀

物体検出 ONNX

そーいえば、RT-DETR(v2)触ったことなかったな。と思って軽くお試しあー、CPU(Core i7-8750H CPU)だと思ったより早くて、GPU(GeForce GTX 1050 Ti)だと思ったより遅いな、、、いや、GPU古いってのもありますが、、、新しめのGPUだと速いんだろーなって雰囲…

2024-09-27

肌、服、髪セグメンテーションにイラストのデータセットを追加しトレーニング🦔

機械学習 Semantic Segmentation PyTorch ONNX

かなーり昔に作ったセグメンテーションモデルの続編ですね。元々目指していた方向性が、MediaPipeのSelfieMultiClassで達成できてしまうので、方向性を変えてイラストも追加して学習してみました。正直、精度はまだまだイマイチです。以下みたいな感じま…

2024-09-12

Anime-Segmentation の ONNX を Colaboraotry上でお試し📚

機械学習 Semantic Segmentation ONNX Colaboratory

CartoonSegmentation触った関連と言うことで、Anime-Segmentation を触っています。ちょっとタスクは違いますが。。。（CartoonSegmentationはインスタンスセグメンテーション、Anime-Segmentation はセマンティックセグメンテーションによる前景抽出、のよ…

2024-09-11

CartoonSegmentationOnnx を Colaboratory でお試し📚

Semantic Segmentation ONNX Colaboratory

CartoonSegmentation のオリジナルはmmcv関連のパッケージがインストール必要で、ちょっと環境構築が面倒だったのですが、ONNXに変換してくれているリポジトリがあったため、Colaboratoryで試してみました。 CartoonSegmentationのONNX助かるーオリジナルリ…

2024-09-01

cloths_segmentationをONNXに変換してお試し🏃

機械学習 ONNX Semantic Segmentation

ある程度近い距離だと綺麗に抜けますね複数人とか遠いとかだとイマイチなので、人検出と組み合わせたりしないとですが。 4年くらい前のU-Netベースのモデルですが、衣服セグメンテーション味見している眼鏡は衣服か、、、アイウェアだしそうか、、、？ pic.t…

2024-08-16

nsfw_modelをONNXに変換して味見🦔

機械学習 ONNX Colaboratory

NSFW（Not Safe For Work：職場での閲覧注意）画像の判定ですNSFWと言ってもアダルト判定のみでグロとか暴力とかは対象外。やりかけで放置していたサンプルソースがポコポコ出てくる、、、これはNSFWモデルをONNX変換したもの。たしか一時期Stable Diffusio…

2024-08-16

MVANetをONNXに変換して味見👻

機械学習 Colaboratory ONNX

MVANetです。BiRefNetと同じくDIS（Dichotomous Image Segmentation）モデルです。あくまで、個人的な感覚ですが、BiRefNetの半分くらいの推論速度で、精度はそれなりと言う感じです重みファイルも半分くらい（約440MB）お試ししたソースコードは以下にコ…

2024-08-15

PINTO_model_zoo：雨除去（310_attentive-gan-derainnet）Pythonデモ追加

機械学習 ONNX

雨除去と言うか水滴除去ですかね後処理がちょっと珍しい感じです。性能はボチボチ？ 310_attentive-gan-derainnetちょっと珍しい後処理と言うか出力の補正が必要各チャンネルごとにスケーリング pic.twitter.com/eLjxGEmL17 — 高橋かずひと@闇のパワポLT職…

2024-08-14

BiRefNetをONNXに変換して味見👻

機械学習 ONNX Colaboratory

BiRefNetをONNXに変換して動作を味見しています。いわゆるDIS（Dichotomous Image Segmentation）モデルです。背景除去、背景分離、Salient Object Detectionとか呼ばれたりもする？Salient Object Detectionは違うか？ ONNX変換後の重みファイルが1GB弱あっ…

2024-08-13

PINTO_model_zoo：暗所ノイズ除去（418_Diffusion-Low-Light）味見👀

機械学習 ONNX

LLIE(Low Light Image Enhancement)のDiffusion-Low-Lightです。個人的な感想ですが、正直、性能に対して重い、、、過去に、動物園のDiffusion Low Lightを味見しようとした形跡があったのだけど、何で途中でやめたんだっけ。。。仕事忙しくなったとかかし…

2024-08-10

OpenVINOで各フレームワーク（ONNX、TensorFlow、TFLite、PaddlePad）の重みを読み込んで推論🦔

OpenVINO Colaboratory PyTorch ONNX Tensorflow PaddlePaddle

Zennに投稿しました。 OpenVINOさん、Colaboratory上でもサクッと動くようになったし、PaddlePaddleのモデルを直接読み込めるし、僕的には結構使い道ありそう zenn.dev ノートブックは以下のリポジトリで公開しています。 github.com 追記：推論時間の比較↓…

2024-08-06

MPCountで群衆カウントお試し👀

機械学習 ONNX CrowdCounting

Crowd Counting(群衆カウント、群衆密度推定)のモデルであるMPCountを味見しています少し余裕が出てきたので、いくつか味見をしているこれは CVPR2024 paper "Single Domain Generalization for Crowd Counting" pic.twitter.com/XcCOCNNAsn — 高橋かずひ…

2024-05-04

XFeatをONNXに変換してお試し👀

Python ONNX 機械学習

CVPR'24 Paper の XFeatをONNXに変換してお試ししています。いわゆる特徴点抽出ですね雑にONNXに変換して動かしてみているけど、、、まあ、精度も速度（CPU）も普通かなー、、、 pic.twitter.com/tARe4AQL5e — 高橋かずひと@闇のパワポLT職人 (@KzhtTkhs) …

2024-04-24

LLIE系モデルLYT-Netお試し🦔

機械学習 Python ONNX

LLIE（Low-Light Image Enhancement）系モデルのLYT-Netお試しです。2024年の比較的新しめのモデルです。比較的新しめのモデルではあるのですが、性能はボチボチふつー、、、と言うか、いつも試している動画の難易度が高すぎる。と言うのはあると思いますが…

2024-04-11

MobileSAM と EfficientSAM も ONNX推論お試し👀

機械学習 Python ONNX Colaboratory Semantic Segmentation

この投稿の続編です。 kazuhito00.hatenablog.com MobileSAM と EfficientSAM の ONNX推論お試しコードを以下にコミットしています。MobileSAMはSAMと同様に、公式リポジトリでエンコーダーのONNXエクスポートが無かったため追加しています。EfficientSAMは…

2024-04-11

Segment Anything Model(SAM)をONNXに変換して推論🦔

機械学習 Python ONNX Colaboratory Semantic Segmentation

本当はもっと早くやりたかったシリーズSAMが登場してから、もう1年たってるんですよね。。。 SAMは凄い良いモデルなのですが、、、公式リポジトリのONNXエクスポートとONNX推論周りのサポートはちょっとイマイチだと思っています。どれくらいイマイチかと言…

2023-12-02

vehicle-reid-0001 お試し👀

MOT 物体検出機械学習 ONNX

ちょっと古いモデルなのですが、vehicle-reid-0001（正確には OSNet Ain Vehicle ReID）を動かしました元はOpenVINO動物園のモデルですね。と言うか、Vehicle ReIDって、結構な確率でモデルのリンク切れしてたり、パッケージの依存関係がアレすぎて、パッ…

2023-11-30

PINTO_model_zoo：人検出（425_Gold-YOLO-Body-Head-Hand）味見👀

機械学習物体検出 Raspberry pi ONNX

PINTOさんがアノテーション気合入れて、トレーニングされたGold-YOLOです昨晩つぶやいた無駄に高解像度だった 640x480 から 320x256 にモデルの入力解像度を落として Float32 CPU推論してみた。ほぼ 3.5倍速になって精度はほとんど落ちなかった。予想外。…

2023-07-12

PINTO_model_zoo：インタラクティブセグメンテーション（391_MagicTouch）Pythonデモ追加

機械学習 ONNX

MagicTouch 味見速度の割に精度良いですね MagicTouch味見さすがに動作早いなー。これCPU推論(Core i7-8750H)です。マウスカーソル当てたところを対象にセグメンテーション https://t.co/SGywr3mL1T pic.twitter.com/TiSvte8Uxd — 高橋かずひと@闇のパワポ…

高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。　お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

ONNX

DEIMv2 の ONNX変換と Colaboratory上でのトレーニング👀

音声強調モデル LiSenNet をONNXに変換🦔

音声復元モデル VoiceFixer をONNXに変換🦔

PINTO_model_zoo：インスタンスセグメンテーション（470_RHIS）味見👀

ナンバープレート検出と認識ＡＩのプロトタイプ🚙

ノードエディターベースのオーディオ処理ツールを作りました🦔

Speech Enhancement（音声強調）モデルGTCRNお試し🎤

DEIM（高速収束のためのマッチングを改善した DETR）をColaboratoryで実行👀

RT-DETRの改良モデル？ D-FINEをお試し🦔

PINTO_model_zoo：人検出＋顔向き＋属性判定＋パーツ検出モデル（460_RT-DETRv2-Wholebody25）味見👀

RT-DETR(v2) を Colaboratoryでトレーニングするサンプル👻

RT-DETR(v2) を ONNX推論おためし👀

肌、服、髪セグメンテーションにイラストのデータセットを追加しトレーニング🦔

Anime-Segmentation の ONNX を Colaboraotry上でお試し📚

CartoonSegmentationOnnx を Colaboratory でお試し📚

cloths_segmentationをONNXに変換してお試し🏃

nsfw_modelをONNXに変換して味見🦔

MVANetをONNXに変換して味見👻

PINTO_model_zoo：雨除去（310_attentive-gan-derainnet）Pythonデモ追加

BiRefNetをONNXに変換して味見👻

PINTO_model_zoo：暗所ノイズ除去（418_Diffusion-Low-Light）味見👀

OpenVINOで各フレームワーク（ONNX、TensorFlow、TFLite、PaddlePad）の重みを読み込んで推論🦔

MPCountで群衆カウントお試し👀

XFeatをONNXに変換してお試し👀

LLIE系モデルLYT-Netお試し🦔

MobileSAM と EfficientSAM も ONNX推論お試し👀

Segment Anything Model(SAM)をONNXに変換して推論🦔

vehicle-reid-0001 お試し👀

PINTO_model_zoo：人検出（425_Gold-YOLO-Body-Head-Hand）味見👀

PINTO_model_zoo：インタラクティブセグメンテーション（391_MagicTouch）Pythonデモ追加