Python
雑メモです👀 S3からファイルをダウンロードするやつです。
雑メモです👀 Kinesis Videoから動画をダウンロードするやつです。GetClipは数分程度の動画しか取れないため、細切れの動画を沢山ダウンロードします🦔
CVPR'24 Paper の XFeatをONNXに変換してお試ししています。いわゆる特徴点抽出ですね 雑にONNXに変換して動かしてみているけど、、、まあ、精度も速度(CPU)も普通かなー、、、 pic.twitter.com/tARe4AQL5e — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) …
LLIE(Low-Light Image Enhancement)系モデルのLYT-Netお試しです。2024年の比較的新しめのモデルです。 比較的新しめのモデルではあるのですが、性能はボチボチふつー、、、と言うか、いつも試している動画の難易度が高すぎる。と言うのはあると思いますが…
最近サルベージしてたブレ補正系の作業はいったんMeshFlowでおしまいです 動画の動きと相性があるのか試したやつだと、あんまり良い見た目になりませんでした。あとMeshFlowは何ステップかに処理が分かれていて、かなり処理時間かかる MeshFlowというブレ補…
ひとつ前の投稿で書いたVidStabが、いわゆるレガシーな画像処理的なブレ補正だとすると、GlobalFlowNetは、いわゆるDeep系なブレ補正です。 ブレ補正の性能は高いと思いますが、、、処理時間がかかるのと、GlobalFlowNetは画像を出力する際に画質が劣化する…
VidStabというライブラリを使用した動画のブレ補正です。キーポイントマッチングとアフィン変換を使用した、いわゆるレガシーなブレ補正手法なライブラリです。 Deep系なアルゴリズムに比べて、処理速度が速い傾向があり、そこそこ補正できるような感じです…
この投稿の続編です。 kazuhito00.hatenablog.com MobileSAM と EfficientSAM の ONNX推論お試しコードを以下にコミットしています。MobileSAMはSAMと同様に、公式リポジトリでエンコーダーのONNXエクスポートが無かったため追加しています。EfficientSAMは…
本当はもっと早くやりたかったシリーズSAMが登場してから、もう1年たってるんですよね。。。 SAMは凄い良いモデルなのですが、、、公式リポジトリのONNXエクスポートとONNX推論周りのサポートはちょっとイマイチだと思っています。 どれくらいイマイチかと言…
YOLO-World試そう試そうとは思ってたのですが、仕事がバタバタしてて、 今更触りました 気が付いたらv2になっていたわけですが、v1との違いは良く分からないなー 以下の動画の最後のほうの「hand」は頑張っているとは思いますが。 YOLO-Worldもv2になってた…
以下のツールをGUIでくるんだ簡易ビューアです 今回はGUIフレームワークにFletを使用しています。 ちょっと前?に話題になって、触ろう触ろうと思ってたのですが、今回初めて触りました。設計思想とかデザインとか結構好みな感じです 触ろう触ろうと思ってて…
表題の通りです。完全に趣味の産物ですが、いったん、それなりに動くところまで来たのでGitHubに公開しました github.com 昨日ザッと書き上げた時は、ブロックデータを画像に直す処理が結構遅かったのですが、本日何とか許容範囲(個人の感想です)になりま…
年始のLT資料に入れたQRコードです。 QRコード作成用のPythonスクリプトが、HDDのこやしになっていたので、供養もかねてZenn書きました🦔 zenn.dev
結構前に作りかけてて、途中で飽きて(使う予定の案件がぽしゃって)放置していたリポジトリです。 整理してGitHubに公開しました ちょっと前に飽きて作るの放置してたDetection→PoseEstimationのリポジトリを掘り起こしてきたYOLOX→RTMPose pic.twitter.com…
大したスクリプトでもないのに大分放置してしまった、、、 こーいうのは、さっさとアウトプットして、サクサク次行かなきゃと思っているのに、寝かせてしまっていました NumPyのmemmap()を使って、OpenCVの画像を他プロセスに受け渡すやつ、大したスクリプト…
夏季休暇シーズンなので、動物園に遊びに行くLTをしてきました🦔 発表資料は以下です。 ちなみに今回のLTの一番大事なところです👻↓ あと、まだ勉強会は未定ですが、リポジトリへの貢献の話とか追加して、ver1.0資料とする予定です👀
以下で公開されている「colab_utils.py」を利用すると、Colaboratory上で簡易なバウンディングボックスのアノテーションが出来ます。※クラス指定はできない TensorFlowのリポジトリで公開はされていますが、TensorFlow依存無しで利用できます https://github…
NGK2023S(名古屋合同懇親会 2023新年会)で発表してきました昨年同様oViceとYouTubeライブを活用したオンライン開催でした。 今年も多種多様な発表があって、楽しかったですねー。 来年こそはオフラインハイブリッド開催されることを祈っています そして、…
NiceGUI は、 Pythonベースの UI フレームワークで、Webブラウザで表示するタイプのやつです。 Streamlit は、おまじないが多く、それらを解決するために作成したようです。 JustPyをラッピングする形で実現されているようです(JustPyは低レイヤーの処理が…
Informative Drawingsの味見をしています。 以下のような変換が出来るモデルです。 左上:元画像、右上:Anime Style 左下:OpenSketch Style、右下:Countour Style GPUは必要ですが、Webカメラ入力で動作させてみました。 それなりに動いていますね Inform…
久々のメモ書きです👀 ちょいちょい使いたくなる辞書へのドットアクセスのメモです。
どこにもメモった形跡が無いので、改めてメモ kazuhito00.hatenablog.com 上記のモデルをONNXでGPU推論しようとすると以下のようなエラーが出ます。 onnxruntime.capi.onnxruntime_pybind11_state.Fail: [ONNXRuntimeError] : 1 : FAIL : Non-zero status co…
DearPyGuiにノードエディター機能があるのを知って、 ここ一週間くらいノードエディター+画像処理的なツールを作っていました 完全に自分のための仕様で、僕の仕事とかには使える作りにはなっているのですが、 実装済みのノードにはかなり偏りがあります 以…
はじめに PyCon mini Shizuokaでオンライン登壇してきました。 オンライン参加 と ライブビューイング参加 の組み合わせで開催されました。 今回はオンライン前提だったこともあり、トークは事前収録で進められました。 オンライン前提だと事前収録は当日が…
今年に入ってからAxross様に技術記事を寄稿しています。 5つ寄稿し、多少キリが良いのでまとめて紹介しようと思います。 今のところ確定で1本寄稿を予定しており、評判が良ければ追加寄稿をAxross様と相談します。 Axrossとは 以下の理念で運営されているサ…
OpenCV 4.5.3にてDaSiamRPNトラッカーが実装されたので試してみました。 比較してみるとDaSiamRPNの精度が高いことが分かります DaSiamRPN、MIL、CSRT、KCF並べてみる。並べるとDaSiamRPNの精度が際立つな、、、 https://t.co/Rofyg2TnYY pic.twitter.com/j0…
いつのまにかPython版のOpenCV(contrib)でimg_hashモジュールが使えるようになっていたのでメモです(もしかして結構前から使えるようになってた、、、🦔? ソースコードは以下にコミットしています。
少々古いモデル(2019年9月)ですが、CenterFaceの顔検出を動かしました。 顔検出は1年くらい新しいモデルに触れていなかったのですが、 技術は日進月歩と言うところか、速度、精度が良いですね 多少、横向いたくらいでは検出が外れませんし、この精度のまま、…
OSC2020 Online Nagoya の Python東海/JuliaTokaiミニ合同勉強会にてLTをしてきました。 Jupyter notebook + RISEを使ったプレゼンテーションでリアルタイムな画像処理デモをやるお話です プレゼンテーション + リアルタイムデモ系のやりたかったことは一通…
Pythonデータ分析勉強会#19で発表してきました PyCaretの紹介的な内容です。 今回はJupyter notebook+RISEで資料を作成しており、 Youtube版とSpeakerDeck版に加え、Binder版もあります。 発表資料は以下です。 www.youtube.com speakerdeck.com Binderは以…