高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

【Unagi.py 56枚目】動物園(PINTO_model_zoo)に遊びに行こう🦔

夏季休暇シーズンなので、動物園に遊びに行くLTをしてきました🦔 発表資料は以下です。 ちなみに今回のLTの一番大事なところです👻↓ あと、まだ勉強会は未定ですが、リポジトリへの貢献の話とか追加して、ver1.0資料とする予定です👀

Albumentations で XYZ軸回転のデータ拡張をするメモ🦔

以下の投稿の続きです👀 Albumentationsで使うことを想定していたので、そのメモをZennに残しています。

OpenCVでX軸、Y軸、Z軸の回転を行うサンプル🦔

たまーに3次元回転したいことありますよね ネット上に結構サンプルがある処理ですが、データ拡張に使うときに少々カスタマイズが必要だったりしたので、自分の使いやすいものを作成しました。 OpenCVってロール、ピッチ、ヨーの画像回転って無かったっけ?と…

OpenCVのNanoTrackを動作確認👀

OpenCV4.7かどこかのアップデートで入ったNanoTrackです。 確かアップデート当時に、バグかドキュメントが間違っているか何かでサクッと動作確認できなかったので、放置していたのですが、自分のサンプルリポジトリにプルリクいただいたので確認してみました…

PINTO_model_zoo:インタラクティブセグメンテーション(391_MagicTouch)Pythonデモ追加

MagicTouch 味見 速度の割に精度良いですね MagicTouch味見さすがに動作早いなー。これCPU推論(Core i7-8750H)です。マウスカーソル当てたところを対象にセグメンテーション https://t.co/SGywr3mL1T pic.twitter.com/TiSvte8Uxd — 高橋 かずひと@闇のパワポ…

PINTO_model_zoo:霧除去・雨除去・雪除去(389_WGWS-Net)Pythonデモ追加

霧除去です。雨除去と雪除去の訓練済みの重みも同梱されています 基本的に僕はCPU推論で試そうと思っているのですが、 以下はかなり重かったのでGPU推論(GeForce GTX 1050 Ti)です WGWS-Net 640x480味見おーもーいーなー。除去性能は今までのモデルと有意な…

【Python東海#43】Image-Processing-Node-Editor

Image-Processing-Node-Editor のお話しをLTしてきました 僕の中ではImage-Processing-Node-Editor系の発表は年始のNGKで一区切りついていたのですが、1年前のOSC2022でやったLTがどうなったかを報告する意味もこめて、Python東海でLTしてきました。 資料は…

YOLOPv2 ONNX推論お試し👀

ある意味、以下の投稿の続編ですね。 ただ、YOLOPとYOLOPv2は作者違う? これですね。YOLOPv2 https://t.co/SX7I4dcvD2 pic.twitter.com/0NpGXq8peC — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年7月7日 コードは以下です。 いつものごとく、前処理…

【機械学習名古屋 2023/06/24】Visual Blocks for ML

機械学習名古屋がオフライン開催をリブートするということで参加してきました 本編は ChatGPT API を利用した LINE BOTのハンズオンです。 講師対応いただいたミウラさんありがとうございました LT発表も多く、資料は以下のリンクからご確認ください。 私は…

PINTO_model_zoo:暗所ノイズ除去(385_PairLIE)Pythonデモ追加

PairLIE味見 あくまで個人的な意見ですが、旧来のモデルに対して特段性能が高い感じはしませんでした。 そして結構処理が重い PairLIEさん補正性能自体はそこそこ(今まで見たモデルと比べて50歩100歩ではある)だけど、処理重いなー。。。512x512のサイズを…

PaddleOCRをONNXに変換してお試し🦔

PaddleOCRは、個人的には結構信頼しているOSSのOCRです ちょいちょい案件とかで使ったこともありますが、PaddlePaddle依存なのがちょっと困るケースある感じでした(運用環境には複数の機械学習フレームワークを混在させたくないし。。。) ONNX変換手順は公…

Visual Blocks for ML お試し👀

GoogleさんのVisual Blocks for MLを触ってみています 前処理とか、Image⇔Tensorの変換とか、を明示的に行う必要があるので、ガチの初心者や非エンジニアの方には若干難しい気もしますが、そこを分かっている人には手軽で良いツールだと思います。 ノードの…

Axross様への寄稿まとめ(No.06~No.15)

最近まとめていなかったため、まとめです 以前のまとめは以下です。 kazuhito00.hatenablog.com 寄稿したレシピ 前回まとめたものから追加で10本寄稿しています。 タイトル:MoveNetのキーポイントからボディランゲージを読み取るレシピ ※有料記事 要素技術…

Colaboratory上で簡易なアノテーション🦔

以下で公開されている「colab_utils.py」を利用すると、Colaboratory上で簡易なバウンディングボックスのアノテーションが出来ます。※クラス指定はできない TensorFlowのリポジトリで公開はされていますが、TensorFlow依存無しで利用できます https://github…

LDC + 細線化アルゴリズム をお試し👻

以下の投稿の続きです。 LDCでエッジ抽出した後に、OpenCVの細線化アルゴリズムを試してみました。 ■オリジナル画像 ■LDC(Average Image) ■細線化(GUOHALL) ソースコードは以下です。 Colaboratoryで処理が完結します👀

LDC: Lightweight Dense CNN for Edge Detection(線画抽出) を ONNX に変換して味見👀

モデル入力の解像度が高ければ、精度はかなり良い感じだと思います 以下は入力サイズ3840x2160のONNXを作って試した例。 ただし、推論は数秒~数十秒かかります。 PINTOさんのツイートで見かけたLDCを味見 1枚目:オリジナル画像 2枚目:5枚出力される結果の…

単眼深度推定 Lite-Mono を ONNX に変換して味見👀

Lite-Monoは、軽量 CNN と トランスフォーマー を組み合わせた単眼深度推定だそうです 少し動かしてみた感じ、軽さの割に精度が良いと思います。 さっき Explore に出てた単眼深度推定を、CPU推論(Core i7-8750H)で確認速度はボチボチ早くて、精度も結構ディ…

暗所ノイズ除去モデル FLW-Net を ONNX や TFLite(onnx2tf使用)に変換して動作確認👀

正直LLIEはデータセットの問題なのか、どのモデルも一長一短な感じがしますね。 FLW-Net 動作確認 & 速度比較320x240サイズで i7 CPUです。左からONNX、TFLite(num_threads=1)、TFLite(num_threads=4) で、TFLiteへ変換するツールはonnx2tfです pic.twitter.…

日経Linux2023年5月号に「Image-Processing-Node-Editor」を取り上げていただきました👾

日経Linux2023年5月号の「フリーソフト究極活用術」特集に「Image-Processing-Node-Editor」を取り上げていただきました 日経Linux2023年5月号を御恵贈いただきましたからあげさん寄稿によるImage-Processing-Node-Editorの紹介記事が載っています。チラ見せ…

ハンドキーポイント分類向けModel Zoo🦔

以下のリポジトリのやつです スター数にしては、フォーク数が多く(2023年4月5日時点 310スター 213フォーク)色々な人に使用いただいているのは知っていたのですが、 今回フォーク先を片っ端から覗きにいって、動いたものをまとめました とりあえず、片っ端…

参考資料:Mobility Technologies (MoT) さんの発表資料いろいろ

Twitterのブックマークに放り込んでいたのですが、、、Twitterのブックマークって、あっと言う間に流れていき、見たくなった時に、いつも探し回るので、こちらにメモ もう結構古い資料も混ざっていますが、今でも勉強になる資料がいっぱいです。 あと、MoTさ…

参考資料:機械学習の社会実装とか失敗とか

Twitterのブックマークに放り込んでいたのですが、、、Twitterのブックマークって、あっと言う間に流れていき、見たくなった時に、いつも探し回るので、こちらにメモ👀 失敗から学ぶ機械学習応用 from Hiroyuki Masuda

参考資料:「私考える人、あなた作業する人」を越えて、プロダクトマネジメントがあたりまえになるチームを明日から実現していく方法

Twitterのブックマークに放り込んでいたのですが、、、Twitterのブックマークって、あっと言う間に流れていき、見たくなった時に、いつも探し回るので、こちらにメモ👀 speakerdeck.com

参考資料:羽山さんのUXデザイン発表資料

Twitterのブックマークに放り込んでいたのですが、、、 Twitterのブックマークって、あっと言う間に流れていき、見たくなった時に、いつも探し回るので、こちらにメモ 「のどが渇いた」というユーザーに何を出す? ユーザーの「欲しい」に惑わされない、本当…

ChatGPTにプログラム任せられるの👀?

10万行のプログラムとかは当然任せられませんね、、、 ただ100行程度のサンプルくらいならサクッと作ってくれるのは確か ChatGPT使って、さすがに「ノードエディター形式の画像処理ツールをプログラムしてください」は無理だけど、「MediaPipeを使って手を検…

3値化(Multi-Otsu Thresholding)お試し🦔

そーいや、3値化(Multi-Otsu Thresholding)って、どんなところで使い道あるんだろ?2値化は結構使うけど、僕は3値化は実用で使ったことないなー pic.twitter.com/txaLbt1u46 — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年3月14日 こんな一例がある…

PINTO_model_zoo:背景除去(353_ShadowFormer)Pythonデモ追加

影除去モデルのShadowFormerの味見です マスク画像がちゃんとしていると結構綺麗に影が消えます。 処理時間はかなり重め。 まあ、入力画像の他にマスク画像も必要ですし、リアルタイム前提ではないですね。 ShadowFormerもっかい味見気合入れてマスク画像作…

背景除去(DIS)の isnet-general-useモデルの性能をお試し👀

以下の投稿の続編です。 isnet-general-use.pth モデルのほうが強い? 髪と腕の間も切り抜けているようですね。 pic.twitter.com/zzFpH7SltZ — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年2月25日 isnet-general-use.pth ってアップデートで追加さ…

PINTO_model_zoo:背景除去(313_IS-Net)Pythonデモ追加

背景除去のIS-Netの味見です アップデート版のモデルがオリジナルリポジトリに更新されているようなので、後で見に行きます。 PINTOさん動物園からIS-Net拾ってきて味見背景削除さん pic.twitter.com/JMtuYc3gwG — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkh…

PINTO_model_zoo:擬態検出(299_DGNet)Pythonデモ追加

擬態物体検出の味見です 擬態動画で良いのが中々見つからないなー。 昆虫とか色々試してみたい DGNet味見Camouflaged Object Detection(擬態物体検出)です pic.twitter.com/98xJKnszrU — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年2月24日 デモコー…