高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

PINTO_model_zoo:擬態検出(299_DGNet)Pythonデモ追加

擬態物体検出の味見です 擬態動画で良いのが中々見つからないなー。 昆虫とか色々試してみたい DGNet味見Camouflaged Object Detection(擬態物体検出)です pic.twitter.com/98xJKnszrU — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年2月24日 デモコー…

PINTO_model_zoo:霧除去(325_DehazeFormer)Pythonデモ追加

DehazeFormer味見 もしかしたら前処理か後処理間違っているかも? ちょっと補正が弱すぎる気がする DehazeFormerうーん、、、?何か間違えたか?霧除去能力こんな低くないよな? pic.twitter.com/2Xx66m3zLR — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2…

PINTO_model_zoo:ブラー除去(323_Stripformer)Pythonデモ追加

ブラー除去のStripformerさん味見 ブラー除去のモデルはどれも重いなーーー。軽いのどっかに無いかなーーー。 Stripformerさん、名前と重みのサイズから予想はしていたけど、、、処理が重いなー320x240のサイズでも、しょぼGPU(GeForce GTX 1050 Ti)推論じゃ…

PINTO_model_zoo:単眼深度推定(314_PyDNet2)デモ追加

PyDNet2を味見中 最近、単眼深度推定を触っていませんでしたが、たぶん早い。 もう半年以上前のコミットじゃったか、、、PyDNet2味見pydnet2_192x512 の CPU推論です。 https://t.co/bZ7mSPinrc pic.twitter.com/s0Fl7YyQ3F — 高橋 かずひと@闇のパワポLT職…

PINTO_model_zoo:超解像(351_RFDN)Pythonデモ追加

久々に超解像の味見です ちょっと間が空いてしまいましたが、、、RFDNを味見CPU推論で160x120→640x480の超解像がこの速度ならかなり早いんじゃない? https://t.co/WHsJyG2StK pic.twitter.com/pxcq0LKaHW — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 202…

暗所ノイズ除去(SCI)の3種モデル(easy、medium、difficult)をお試し👀

以下の投稿をした後、1ヶ月後くらいにオリジナルリポジトリのほうで、リファクタリングがあったぽく、モデル種類が3種(easy、medium、difficult)に増えていたので確認してみました。 ただ、あんまり違いは分からないですね。 動画との相性もあるかもですが、…

PINTO_model_zoo:暗所ノイズ除去(348_Bread)Pythonデモ追加 + γ値とStrength指定デモ

以前取り扱ったLLIE系のモデルに比べると若干重い感じはしますが、、、 補正性能や昼間での暴れなさは中々性能が高いように見えます BreadさんをとりあえずONNXに変換して味見入力画像の他にgammaとstrengthを受け取るモデルです https://t.co/LaAprGMmfY pi…

【NGK2023S】 ノードエディタ形式の画像処理ツール「Image-Processing-Node-Editor」

NGK2023S(名古屋合同懇親会 2023新年会)で発表してきました昨年同様oViceとYouTubeライブを活用したオンライン開催でした。 今年も多種多様な発表があって、楽しかったですねー。 来年こそはオフラインハイブリッド開催されることを祈っています そして、…

ATOM Cam2で庭にくる野良猫?を監視👀

野良猫?が庭に来て粗相している疑惑があったので、ATOM Cam2で庭を監視しました 地面を掘り返して粗相する動物が猫しか思いつかなかったのですが、猫よけ撒いて効果が無かったので、本当に猫かどうか裏を取りました。 購入して数ヶ月?放置していたATOM Cam…

PINTO_model_zoo:人物属性判定(124_person-attributes-recognition-crossroad-0230 ~ 126_person-attributes-recognition-crossroad-0238)デモ追加

人物の属性判定を試しています まあ、正直当たったり当たらなかったりと言うか、、、 トレーニングに使われたデータセットが十中八九日本人じゃないので、精度もイマイチと言うか 属性によっては精度は多少信頼しても良さそうですが 属性判定あってるよーな…

2022年振り返り その3:Twitter

振返りその3です。 アーカイブリクエストから、ダウンロード可能になるまで5日くらいかかって、年を跨いでしまいました マサカリの数は昨年末から比較すると約1,000人増えてます フォロワー:2,867 → 3,876 Word Cloud Word Cloudの作成は昨年に引き続き、…

2022年振り返り

はじめに 12/28(水)に仕事納めしました。 あとは、だらだらとLT資料作ったり、プログラム作ったり、 とあるスタートアップのお手伝いしたり、Axross寄稿原稿書いたりするだけの予定なので、 2022年の振り返りをしたいと思います。 思ったより作りたいものあ…

2022年振り返り その2:Kindle

からあげさんの「Kindleの蔵書情報をKindleアプリのXMLをパースして可視化する方法」です。 前回は昨年の12月31日にやっていますね。 Amazon Product Advertising API(商品情報API)追加版ノートブック 昨年使用したものを使おうと思っていたのですが、何か…

2022年振り返り その1:GitHub

年末と言うことでGitHubリポジトリの振り返りです 以下は昨年の投稿。 WORKS.md 今まで作成したリポジトリで対外的に公開しているものは、 以下のWORKS.mdに整理して公開しています。 ※画像が多いため転送量注意 公開ノートブック PyGitHubを用いたデータ集…

FreeYOLO(CrowdHuman)のお試し👀

人検出の精度高いやつが欲しくてFreeYOLOのCrowdHumanトレーニングバージョンを試しています CPUでも早くて、小さい対象も検出出来ているし、中々良さそう。 ちょっと別案件の人検出をFreeYOLO(CrowdHuman)に任せようか検討中まあ、添付の動画は無茶なんです…

Qiita:NiceGUI と OpenCV を組み合わせたい。

OpenCV Advent Calendar 2022の23日目に投稿しました👻 qiita.com

Qiita:ノードエディタ形式の画像処理ツール「Image-Processing-Node-Editor」

OpenCV Advent Calendar 2022の21日目に投稿しました👻 qiita.com

FreeYOLOのONNX推論お試し👀

DAMO-YOLOに引き続き、PINTO さんがツイートしていた FreeYOLOをお試ししています "FreeYOLO - Anchor-free YOLO detector." アンカーフリーなのってYOLOって呼んでいいのかな。ネーミングはもう一切気にしないですけども。「New AP results and weight file…

PINTO_model_zoo:物体検出(336_PP-YOLOE-Plus)デモ追加

PP-YOLOE-Plus の 味見 PP-YOLOE-PlusのSの640x640をCPU推論で味見いや、もう正直モデルの良し悪しは、この程度の動画推論くらいじゃ分かりませんね。。。パラメータ数相応の推論速度だとは思うし、ファインチューニングしたとき強いかは分かりませんし。。…

DAMO-YOLOをColaboratory上でトレーニングするサンプル👻

ある意味、以下の続編です。 以下にコミットしています。 いったん公開はしていますが、正直、暫定対応なところとか無理矢理なところとかがちょいちょいあってクオリティはあんまり高くないです。。。 そのうち改善されてくるでしょうけど、、、 暫定対応は2…

PINTO_model_zoo:セマンティックセグメンテーション(335_PIDNet)Pythonデモ追加

早いセマンティックセグメンテーションと噂のPIDNet味見 pidnet_S_cityscapes_544x960 CPUで味見このサイズでこのスピードは速いかしら。少々検出が不安定にも見えますが https://t.co/IgSWP8Bo0H pic.twitter.com/eXvZQBOyNq — 高橋 かずひと@闇のパワポLT…

PINTO_model_zoo:姿勢推定(333_E2Pose)デモ追加

E2Pose です 複数人の姿勢推定をEnd2Endで実行するモデルですね。 TensorRTでGPU推論するとかなり早い模様です。 今回はCPU推論でお試し。 PINTOさん動物園のE2PoseをCPU推論でお試し確認中 pic.twitter.com/V3kyU19EUy — 高橋 かずひと@闇のパワポLT職人 (@…

DAMO-YOLOのONNX推論お試し👀

PINTO さんがツイートしていた DAMO-YOLO の ONNX推論を試しています もはや何を認識しているのか分からない。凄いのかもしれない。"DAMO-YOLO" pic.twitter.com/62NRc8xqYV — Super PINTO (@PINTO03091) 2022年12月6日 すばらしい。 pic.twitter.com/XxcWEH…

Ogaki Mini Maker Faire 2022に出展しました🦔

Ogaki Mini Maker Faire 2022 に出展しました 今回は、からあげさんと「AI Zoo Keeper」と言うグループで参加しています。 雑多にAI系のデモを展示する感じです。気合でアレやコレや乗せた感 高橋側の展示物は以下3点です Deep写輪眼 & 写輪眼オーバーレイ (…

PINTO_model_zoo:単眼深度推定(210_SC_Depth_pl v3)デモ追加

SC Depth pl の v3です。 192x320で、このエッジの取れ具合は凄いな Image-Processing-Node-Editorに取り込もうかしら →(2022/11/15追記) SC Depth pl が GPL v3なので取り込まない おー、CPU推論でこの速度・精度だと、かなり凄いんじゃない?入力サイズは1…

OpenCVのremap()を用いてメッシュ変形👻

OpenCVのremap()を用いてメッシュ変形的な変換を行うサンプルを作成しました。 OpenCVでメッシュ変形的なやつ。ソースコード整理したぐりぐり動かしてパラメータ保存するスクリプトと、変換だけするスクリプトの2つにした pic.twitter.com/abXthtTMLl — 高橋…

Pop2PianoでPop音楽ベースのピアノカバー生成お試し👀

Pop音楽ベースのピアノカバーのMIDI生成が出来るPop2Pianoの味見をしています。 以下のプロジェクトページではいくつかのデモも聞くことが出来ます。 公式でColaboratoryのノートブックが提供されているので、それを開いてGPUランタイムで上から実行していけ…

onnx2tf で高速なTFLiteモデルに変換🏃

onnx2tf です。 onnx-tensorflowじゃないです PINTOさんが開発されているツールで、 ONNXファイルをTensorFlow/TensorFlow-Lite形式に変換するツールです。 どうもonnx-tensorflowで変換をかけると、 無駄に大量のTransposeが挿入される(何か機械的な変換で…

NiceGUI お試し👀

NiceGUI は、 Pythonベースの UI フレームワークで、Webブラウザで表示するタイプのやつです。 Streamlit は、おまじないが多く、それらを解決するために作成したようです。 JustPyをラッピングする形で実現されているようです(JustPyは低レイヤーの処理が…

Mubert-Text-to-Music での音楽生成お試し🦔

イラスト生成AIが盛り上がったと思ったら、次は音楽生成ですね。 進歩のスピードが速くて驚きます。ホントに。 お試しした感想は、クオリティは高いけどプロンプトで狙った通りの雰囲気出すの難しいなー。て感じです。 そもそもソースコード的には、プロンプ…