高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

Keras Code examples 「Keypoint Detection with Transfer Learning」のダメそうなポイントのメモ🦔

Keras Code examples の「Keypoint Detection with Transfer Learning」と言うサンプルを改善しようとチマチマ眺めていたけど、無理っぽい気がしたので供養する投稿です Keras Code examples 結構好きなんですけど、キーポイント検出の内容はずっと気になっ…

GlobalFlowNetで動画のブレ補正をお試し🦔

ひとつ前の投稿で書いたVidStabが、いわゆるレガシーな画像処理的なブレ補正だとすると、GlobalFlowNetは、いわゆるDeep系なブレ補正です。 ブレ補正の性能は高いと思いますが、、、処理時間がかかるのと、GlobalFlowNetは画像を出力する際に画質が劣化する…

VidStabで動画のブレ補正🐦

VidStabというライブラリを使用した動画のブレ補正です。キーポイントマッチングとアフィン変換を使用した、いわゆるレガシーなブレ補正手法なライブラリです。 Deep系なアルゴリズムに比べて、処理速度が速い傾向があり、そこそこ補正できるような感じです…

MobileSAM と EfficientSAM も ONNX推論お試し👀

この投稿の続編です。 kazuhito00.hatenablog.com MobileSAM と EfficientSAM の ONNX推論お試しコードを以下にコミットしています。MobileSAMはSAMと同様に、公式リポジトリでエンコーダーのONNXエクスポートが無かったため追加しています。EfficientSAMは…

Segment Anything Model(SAM)をONNXに変換して推論🦔

本当はもっと早くやりたかったシリーズSAMが登場してから、もう1年たってるんですよね。。。 SAMは凄い良いモデルなのですが、、、公式リポジトリのONNXエクスポートとONNX推論周りのサポートはちょっとイマイチだと思っています。 どれくらいイマイチかと言…

YOLO-World-v2 の Gradioデモを Colaboratory上でお試し🦔

YOLO-World試そう試そうとは思ってたのですが、仕事がバタバタしてて、 今更触りました 気が付いたらv2になっていたわけですが、v1との違いは良く分からないなー 以下の動画の最後のほうの「hand」は頑張っているとは思いますが。 YOLO-Worldもv2になってた…

CLIP STUDIO PAINT(.clip)や Photoshop(.psd)のレイヤー画像の簡易ビューア📄

以下のツールをGUIでくるんだ簡易ビューアです 今回はGUIフレームワークにFletを使用しています。 ちょっと前?に話題になって、触ろう触ろうと思ってたのですが、今回初めて触りました。設計思想とかデザインとか結構好みな感じです 触ろう触ろうと思ってて…

クリスタのclipファイルから、レイヤー名や画像を取得するツール(非公式)🦔

表題の通りです。完全に趣味の産物ですが、いったん、それなりに動くところまで来たのでGitHubに公開しました github.com 昨日ザッと書き上げた時は、ブロックデータを画像に直す処理が結構遅かったのですが、本日何とか許容範囲(個人の感想です)になりま…

【Python】パワポのオートシェイプでQRコードを作るスクリプト

年始のLT資料に入れたQRコードです。 QRコード作成用のPythonスクリプトが、HDDのこやしになっていたので、供養もかねてZenn書きました🦔 zenn.dev

heron-blip-v1 を Colab で試してから2週間たっている、、、ですって、、、👀

仕事バタバタしてて、あっという間に2週間たってた、、、 v0に比べて性能が結構上がっている感あったのですが、、、 比較結果どっかなくしてしまった。。。 heron-blip-v1味見してる良い感じ https://t.co/Vs1Iy5TwJR pic.twitter.com/dui1kDfrGt — 高橋 か…

【NGK2024S】 それ、パワポですか?

LT

NGK2024S(名古屋合同懇親会 2024新年会)で発表してきましたえーっと、何年ぶりだっけ?オフライン開催でした。 LT大会はオフラインでやると非常に楽しいです。また、来れない方のために、コロナ禍で培った配信技術を生かしてハイブリッド開催となりました…

OpenCVのViTトラッカー味見👀

ViTトラッカーのPRを貰ったため、取り込んで動作確認してみました 結構早いですね。 精度も速度の割にかなり高い気がします。 ViTトラッカーのPR貰ったViTトラッカー結構早いなhttps://t.co/RwaX8LOm35 pic.twitter.com/2W00kJCxMu — 高橋 かずひと@闇のパワ…

LLaVA-JPをColaboratoryでお試し。

VLMは結構興味あって、案件やプライベート含めちょいちょい試しています 身も蓋も無いこと言うと、現時点ではGPT4V(要課金)の性能が図抜けているのですが、、、OSSで簡単に動かせるVLMも、turingmotors/heron や tosiyuki/LLaVA-JP など出てきていて、前提…

2023年振り返り

はじめに 12/29(金)に仕事納めしました(本業は28日、副業案件は29日) 冬休み中は、LT資料作ったり、いくつか試験的なプログラム作ったりかなー もうコレ書いているタイミングも大晦日でギリギリなのですが、2022年の振り返りをしたいと思います だらだら書…

Qiita:【Python】OpenCVでAudio読み込みお試し

OpenCV Advent Calendar 2023の10日目の記事です🦔 qiita.com

試作:ラズパイで音拾ってインターホンの音だったらLINE通知🦔

とりあえず表題の試作品を作りました。 ラズパイと言うかreTerminalですが ※中身はRaspberry Pi CM4 作ったよくあるやつですが、ラズパイで音拾って、インターホンの音だったらLINE通知 https://t.co/xnMJYXqqfS pic.twitter.com/ri0WZ02nTa — 高橋 かずひと…

Qiita:あれ? dnnモジュールのONNX推論早くねえ?いや、やっぱ遅えかも。。。 ※2023/12/05時点

Qiita の OpenCVアドベントカレンダー6日目の投稿です🦔 qiita.com

vehicle-reid-0001 お試し👀

ちょっと古いモデルなのですが、vehicle-reid-0001(正確には OSNet Ain Vehicle ReID)を動かしました 元はOpenVINO動物園のモデルですね。 と言うか、Vehicle ReIDって、結構な確率でモデルのリンク切れしてたり、パッケージの依存関係がアレすぎて、パッ…

PINTO_model_zoo:人検出(425_Gold-YOLO-Body-Head-Hand)味見👀

PINTOさんがアノテーション気合入れて、トレーニングされたGold-YOLOです 昨晩つぶやいた無駄に高解像度だった 640x480 から 320x256 にモデルの入力解像度を落として Float32 CPU推論してみた。ほぼ 3.5倍速 になって精度はほとんど落ちなかった。予想外。…

【Python東海#44】Pydroid3で画像処理🦔

Python東海でLTをしてきました🦔 Pydroid 3で画像処理とかAIを動かすお話です。 ■YouTube ■SpeakerDeck

gpt-4-vision-preview をお試し👻

GPT4-VのAPIが解放されたため試してみています 手軽に高性能なVLMが扱えるのは良いですね。 GPT4-VのAPIをお試し惜しいけど、日本的なものの理解度もかなり高い pic.twitter.com/6PJyTdyDqO — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年11月7日 GPT…

物体検出した結果に対して姿勢推定をする🏃

結構前に作りかけてて、途中で飽きて(使う予定の案件がぽしゃって)放置していたリポジトリです。 整理してGitHubに公開しました ちょっと前に飽きて作るの放置してたDetection→PoseEstimationのリポジトリを掘り起こしてきたYOLOX→RTMPose pic.twitter.com…

OpenLendaで信号機検出をお試し🚥

TuringさんがOpenLendaと言う信号機検出のモデルを公開されていたので、試してみました HugginFaceでデモが公開されているので、さっと試すことができます。 huggingface.co モデルやPyTorchの推論コードは公式リポジトリで公開されています。 pthモデルの他…

Colab AIお試し👀

Colab AIが使えるようになってました。 詳しく確認してませんが、有料プランの人のみ使える? あ、ホントやColab AI使えるようになっとる。 pic.twitter.com/3nyRXCVwGu — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2023年10月7日 右の欄でチャットが出来…

ProPainter(Image Inpainting)お試し👀

非商用&動画前提なので、個人的には使いどころ無く、あまりしっかりチェックしてませんでしたが、ちょっと味見だけしました 非商用&動画前提なので、個人的には使いどころ無く、あまりしっかりチェックしてませんでしたが、たしかにProPainterさん上手く消し…

【Python】NumPyのmemmap()を使って、OpenCVの画像を他プロセスに受け渡すメモ

大したスクリプトでもないのに大分放置してしまった、、、 こーいうのは、さっさとアウトプットして、サクサク次行かなきゃと思っているのに、寝かせてしまっていました NumPyのmemmap()を使って、OpenCVの画像を他プロセスに受け渡すやつ、大したスクリプト…

Heronの学習済モデルをお試し🦔

Turing様が公開したHeronを試しています TechTalk! も良かったですね 仕事のSlack上では、もっといろいろ試していますが(もちろん外に出せない画像で)、学習済モデルとちょっと+αだけで、色々やりたかったことがお手軽に動きました ちょっとアレやコレや…

【Unagi.py 56枚目】動物園(PINTO_model_zoo)に遊びに行こう🦔

夏季休暇シーズンなので、動物園に遊びに行くLTをしてきました🦔 発表資料は以下です。 ちなみに今回のLTの一番大事なところです👻↓ あと、まだ勉強会は未定ですが、リポジトリへの貢献の話とか追加して、ver1.0資料とする予定です👀

Albumentations で XYZ軸回転のデータ拡張をするメモ🦔

以下の投稿の続きです👀 Albumentationsで使うことを想定していたので、そのメモをZennに残しています。

OpenCVでX軸、Y軸、Z軸の回転を行うサンプル🦔

たまーに3次元回転したいことありますよね ネット上に結構サンプルがある処理ですが、データ拡張に使うときに少々カスタマイズが必要だったりしたので、自分の使いやすいものを作成しました。 OpenCVってロール、ピッチ、ヨーの画像回転って無かったっけ?と…