高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

機械学習

背景除去(DIS)の isnet-general-useモデルの性能をお試し👀

以下の投稿の続編です。 isnet-general-use.pth モデルのほうが強い? 髪と腕の間も切り抜けているようですね。 pic.twitter.com/zzFpH7SltZ — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年2月25日 isnet-general-use.pth ってアップデートで追加さ…

PINTO_model_zoo:背景除去(313_IS-Net)Pythonデモ追加

背景除去のIS-Netの味見です アップデート版のモデルがオリジナルリポジトリに更新されているようなので、後で見に行きます。 PINTOさん動物園からIS-Net拾ってきて味見背景削除さん pic.twitter.com/JMtuYc3gwG — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkh…

PINTO_model_zoo:擬態検出(299_DGNet)Pythonデモ追加

擬態物体検出の味見です 擬態動画で良いのが中々見つからないなー。 昆虫とか色々試してみたい DGNet味見Camouflaged Object Detection(擬態物体検出)です pic.twitter.com/98xJKnszrU — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年2月24日 デモコー…

PINTO_model_zoo:霧除去(325_DehazeFormer)Pythonデモ追加

DehazeFormer味見 もしかしたら前処理か後処理間違っているかも? ちょっと補正が弱すぎる気がする DehazeFormerうーん、、、?何か間違えたか?霧除去能力こんな低くないよな? pic.twitter.com/2Xx66m3zLR — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2…

PINTO_model_zoo:ブラー除去(323_Stripformer)Pythonデモ追加

ブラー除去のStripformerさん味見 ブラー除去のモデルはどれも重いなーーー。軽いのどっかに無いかなーーー。 Stripformerさん、名前と重みのサイズから予想はしていたけど、、、処理が重いなー320x240のサイズでも、しょぼGPU(GeForce GTX 1050 Ti)推論じゃ…

PINTO_model_zoo:単眼深度推定(314_PyDNet2)デモ追加

PyDNet2を味見中 最近、単眼深度推定を触っていませんでしたが、たぶん早い。 もう半年以上前のコミットじゃったか、、、PyDNet2味見pydnet2_192x512 の CPU推論です。 https://t.co/bZ7mSPinrc pic.twitter.com/s0Fl7YyQ3F — 高橋 かずひと@闇のパワポLT職…

PINTO_model_zoo:超解像(351_RFDN)Pythonデモ追加

久々に超解像の味見です ちょっと間が空いてしまいましたが、、、RFDNを味見CPU推論で160x120→640x480の超解像がこの速度ならかなり早いんじゃない? https://t.co/WHsJyG2StK pic.twitter.com/pxcq0LKaHW — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 202…

暗所ノイズ除去(SCI)の3種モデル(easy、medium、difficult)をお試し👀

以下の投稿をした後、1ヶ月後くらいにオリジナルリポジトリのほうで、リファクタリングがあったぽく、モデル種類が3種(easy、medium、difficult)に増えていたので確認してみました。 ただ、あんまり違いは分からないですね。 動画との相性もあるかもですが、…

PINTO_model_zoo:暗所ノイズ除去(348_Bread)Pythonデモ追加 + γ値とStrength指定デモ

以前取り扱ったLLIE系のモデルに比べると若干重い感じはしますが、、、 補正性能や昼間での暴れなさは中々性能が高いように見えます BreadさんをとりあえずONNXに変換して味見入力画像の他にgammaとstrengthを受け取るモデルです https://t.co/LaAprGMmfY pi…

PINTO_model_zoo:人物属性判定(124_person-attributes-recognition-crossroad-0230 ~ 126_person-attributes-recognition-crossroad-0238)デモ追加

人物の属性判定を試しています まあ、正直当たったり当たらなかったりと言うか、、、 トレーニングに使われたデータセットが十中八九日本人じゃないので、精度もイマイチと言うか 属性によっては精度は多少信頼しても良さそうですが 属性判定あってるよーな…

FreeYOLOのONNX推論お試し👀

DAMO-YOLOに引き続き、PINTO さんがツイートしていた FreeYOLOをお試ししています "FreeYOLO - Anchor-free YOLO detector." アンカーフリーなのってYOLOって呼んでいいのかな。ネーミングはもう一切気にしないですけども。「New AP results and weight file…

PINTO_model_zoo:物体検出(336_PP-YOLOE-Plus)デモ追加

PP-YOLOE-Plus の 味見 PP-YOLOE-PlusのSの640x640をCPU推論で味見いや、もう正直モデルの良し悪しは、この程度の動画推論くらいじゃ分かりませんね。。。パラメータ数相応の推論速度だとは思うし、ファインチューニングしたとき強いかは分かりませんし。。…

DAMO-YOLOをColaboratory上でトレーニングするサンプル👻

ある意味、以下の続編です。 以下にコミットしています。 いったん公開はしていますが、正直、暫定対応なところとか無理矢理なところとかがちょいちょいあってクオリティはあんまり高くないです。。。 そのうち改善されてくるでしょうけど、、、 暫定対応は2…

PINTO_model_zoo:セマンティックセグメンテーション(335_PIDNet)Pythonデモ追加

早いセマンティックセグメンテーションと噂のPIDNet味見 pidnet_S_cityscapes_544x960 CPUで味見このサイズでこのスピードは速いかしら。少々検出が不安定にも見えますが https://t.co/IgSWP8Bo0H pic.twitter.com/eXvZQBOyNq — 高橋 かずひと@闇のパワポLT…

PINTO_model_zoo:姿勢推定(333_E2Pose)デモ追加

E2Pose です 複数人の姿勢推定をEnd2Endで実行するモデルですね。 TensorRTでGPU推論するとかなり早い模様です。 今回はCPU推論でお試し。 PINTOさん動物園のE2PoseをCPU推論でお試し確認中 pic.twitter.com/V3kyU19EUy — 高橋 かずひと@闇のパワポLT職人 (@…

Ogaki Mini Maker Faire 2022に出展しました🦔

Ogaki Mini Maker Faire 2022 に出展しました 今回は、からあげさんと「AI Zoo Keeper」と言うグループで参加しています。 雑多にAI系のデモを展示する感じです。気合でアレやコレや乗せた感 高橋側の展示物は以下3点です Deep写輪眼 & 写輪眼オーバーレイ (…

Pop2PianoでPop音楽ベースのピアノカバー生成お試し👀

Pop音楽ベースのピアノカバーのMIDI生成が出来るPop2Pianoの味見をしています。 以下のプロジェクトページではいくつかのデモも聞くことが出来ます。 公式でColaboratoryのノートブックが提供されているので、それを開いてGPUランタイムで上から実行していけ…

onnx2tf で高速なTFLiteモデルに変換🏃

onnx2tf です。 onnx-tensorflowじゃないです PINTOさんが開発されているツールで、 ONNXファイルをTensorFlow/TensorFlow-Lite形式に変換するツールです。 どうもonnx-tensorflowで変換をかけると、 無駄に大量のTransposeが挿入される(何か機械的な変換で…

Mubert-Text-to-Music での音楽生成お試し🦔

イラスト生成AIが盛り上がったと思ったら、次は音楽生成ですね。 進歩のスピードが速くて驚きます。ホントに。 お試しした感想は、クオリティは高いけどプロンプトで狙った通りの雰囲気出すの難しいなー。て感じです。 そもそもソースコード的には、プロンプ…

Informative Drawingsでラフスケッチ風イラストへ変換👀

Informative Drawingsの味見をしています。 以下のような変換が出来るモデルです。 左上:元画像、右上:Anime Style 左下:OpenSketch Style、右下:Countour Style GPUは必要ですが、Webカメラ入力で動作させてみました。 それなりに動いていますね Inform…

PINTO_model_zoo:マルチタスクネットワーク(326_YOLOPv2)デモ追加 ※交通物体検出、道路・ラインセグメンテーション

YOLOPv2の味見をしています PINTOさんとこのYOLOPv2のONNXモデル(320x192)を味見中v1より確かに精度は良いけど、CPU推論だとモデルサイズ相応の推論速度に見える pic.twitter.com/STuSO203MV — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2022年9月3日 YOL…

Image-Processing-Node-Editor v0.2.0リリース🦔

Image-Processing-Node-Editor v0.2.0 をリリースしました リリースと共にWindows向けの実行ファイルも用意しています。 リリース内容は以下です。 BRISQUEノード追加。 地味なノードを追加しているBRISQUEによる画質評価(数値が高いほど悪い) pic.twitter…

PINTO_model_zoo:画像捏造検出(309_ImageForensicsOSN)デモ追加

ImageForensicsOSN味見しています 分かりやすい感じのやつじゃないとうまく行かないですね。 309_ImageForensicsOSN味見中1枚目(公式リポジトリのサンプル)が上手くいくのは当然として、2枚目(無加工)は微妙。。。3枚目(高橋さんがペイントツールでロゴ消し)…

PINTO_model_zoo:物体検出(308_FastestDet)デモ追加

FastestDetに興味があるためチョイチョイ試しています FastestDet味見中速度の対して精度高いですね確かに https://t.co/7aUMOMtRVn pic.twitter.com/tSnKpnXfcM — 高橋 かずひと@パワポ職人 (@KzhtTkhs) 2022年7月10日 公式リポジトリの画像でも感じました…

Image-Processing-Node-Editor の 次のリリースタイミングいつにしよう👀 + WeDX

僕が作ったリポジトリの中で、継続的にメンテナンスしているものは少数派です。 パッと思いつく範囲でも以下の3つぐらい →MediaPipeのマイナーバージョンリリース毎くらいに更新 →更新内容によってはパッチバージョン更新でも追従 →「これだ!」と思った物体…

ノードエディターベースの画像処理ツールを作りました🦔

DearPyGuiにノードエディター機能があるのを知って、 ここ一週間くらいノードエディター+画像処理的なツールを作っていました 完全に自分のための仕様で、僕の仕事とかには使える作りにはなっているのですが、 実装済みのノードにはかなり偏りがあります 以…

PINTO_model_zoo:インスタンスセグメンテーション(295_SparseInst)デモ追加

PINTOさん気合入った改造していたようですが、ぼちぼち動いています 295_SparseInstさん、それっぽく動いている https://t.co/E36eE7VV0t pic.twitter.com/SichLMqJ8S — 高橋 かずひと@駆け出し何でも屋 (@KzhtTkhs) 2022年5月8日 デモコードは以下にコミッ…

PINTO_model_zoo:単眼深度推定(294_FSRE-Depth)デモ追加

FSRE-Depthお試し中🦔 味見👀どうじゃろう。これはCPU推論(Core i7-8750H)ですがなかなかの速度と精度🤔? https://t.co/YPf0xE6roi pic.twitter.com/JLQBdNJ2p1 — 高橋 かずひと@駆け出し何でも屋🦔 (@KzhtTkhs) 2022年5月8日 デモコードはPINTOさんのmodel zooにコ…

Raspberry Pi 4向けのPerson Tracking(CPU推論4スレッドで85~120ms)

トラッキング(motpy)付けると流石に重くなる、、、 ギリギリ10fps前後ですね。 「物体検出オンリーですか?」と聞かれたのでトラッキングも付けてみたRaspberry Pi4 CPUオンリーのPerson Trackingはギリギリ10fps前後 https://t.co/TNrgSwJIi0 pic.twitter.c…

Raspberry Pi 4向けのPerson Detection(CPU推論4スレッドで45~60ms)

Raspberry Pi 4向けの人検出モデルです。 ノートPCとかでも動きますが、ノートPCで動かすくらいならYOLOXとか使ったほうが精度と速度のバランス良いと思います Raspberry Pi4 CPUオンリーのPerson DetectionつづきPINTOさんのTensorflowLite-bin導入するだけ…