高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

PINTO_model_zoo:暗所ノイズ除去(418_Diffusion-Low-Light)味見👀

LLIE(Low Light Image Enhancement)のDiffusion-Low-Lightです。個人的な感想ですが、正直、性能に対して重い、、、 過去に、動物園のDiffusion Low Lightを味見しようとした形跡があったのだけど、何で途中でやめたんだっけ。。。仕事忙しくなったとかかし…

OpenVINOで各フレームワーク(ONNX、TensorFlow、TFLite、PaddlePad)の重みを読み込んで推論🦔

Zennに投稿しました。 OpenVINOさん、Colaboratory上でもサクッと動くようになったし、PaddlePaddleのモデルを直接読み込めるし、僕的には結構使い道ありそう zenn.dev ノートブックは以下のリポジトリで公開しています。 github.com 追記: 推論時間の比較↓…

MPCountで群衆カウントお試し👀

Crowd Counting(群衆カウント、群衆密度推定)のモデルであるMPCountを味見しています 少し余裕が出てきたので、いくつか味見をしているこれは CVPR2024 paper "Single Domain Generalization for Crowd Counting" pic.twitter.com/XcCOCNNAsn — 高橋 かずひ…

SAM2をColaboratoryで味見👀

先週お試ししていましたが、ちょっとバタバタしてて放置してしまっていました。。。 SAM2が発表されたので味見していましたが、これは凄いですね。静止画はちょっとSAMからの進歩分かりにくいですが、Videoトラッキングは結構エグイ うわ、SAM2(Segment Any…

Zenn:Jetson Xavier NX でインターネット経由でリモート接続するメモ ※要ngrok有料プラン

スクラップメモです👀人生で2回目に必要になったので、忘れないようにメモ。 zenn.dev

OpenAI の Moderation API(問題発言検出 ※暴力とかセクシャルとか) を味見👀

ちょっと興味あって、OpenAI の Moderation API を味見しています 「The moderations endpoint is a tool you can use to check whether text is potentially harmful. Developers can use it to identify content that might be harmful and take action, f…

サイバーエージェントのVLM(LLaVA-CALM2-SigLIP)を Colaboratory で味見👀

サンプルスクリプト動かしただけですが、、、 精度良さそうな気がします 遅くなったけど、サイバーのCALM2の日本語VLMをColabで味見した最低L4のGPUじゃないとメモリ不足で動かない pic.twitter.com/5KKQxCxqLP— 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs)…

Pythonでスピードテスト🏃

実は引っ越してから、ずっとWiMAXだったのですが、今日NURO光が開通しました 悪くない速度が出ています。良かった たまに、運悪く下り10Mbpsみたいな状況になって「終わった」とかツイートしている人いるし、ふつーに速度出てよかったです。 ついでにPython…

ChatGPTのAPI(モデル:gpt-4o-2024-05-13)をお試し👀

進化していますね どーいう学習とかアーキ変更とかしたら、スキマナースに対応できるよーになるのか分からん https://t.co/cL8eh9tcuK — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2024年5月13日 これ読めてるのすげーな「鉢は金属製で、1つの鉢には「TOD…

【Python】指定のS3ディレクトリから再帰的にファイルをダウンロード🦔

雑メモです👀 S3からファイルをダウンロードするやつです。

【Python】GetClipを使用してAmazon Kinesis Videoから指定時間分の動画をダウンロードするスクリプト🦔

雑メモです👀 Kinesis Videoから動画をダウンロードするやつです。GetClipは数分程度の動画しか取れないため、細切れの動画を沢山ダウンロードします🦔

XFeatをONNXに変換してお試し👀

CVPR'24 Paper の XFeatをONNXに変換してお試ししています。いわゆる特徴点抽出ですね 雑にONNXに変換して動かしてみているけど、、、まあ、精度も速度(CPU)も普通かなー、、、 pic.twitter.com/tARe4AQL5e — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) …

LLIE系モデルLYT-Netお試し🦔

LLIE(Low-Light Image Enhancement)系モデルのLYT-Netお試しです。2024年の比較的新しめのモデルです。 比較的新しめのモデルではあるのですが、性能はボチボチふつー、、、と言うか、いつも試している動画の難易度が高すぎる。と言うのはあると思いますが…

一人歩きする資料くん👀

一人歩きする資料くんです👀 pic.twitter.com/KBI4GjqFNB — 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2024年4月24日 LT資料に載せようと思ってパッと生成した画像ですが、ちょっと気に入った👀

MeshFlowで動画のブレ補正をお試し🦔

最近サルベージしてたブレ補正系の作業はいったんMeshFlowでおしまいです 動画の動きと相性があるのか試したやつだと、あんまり良い見た目になりませんでした。あとMeshFlowは何ステップかに処理が分かれていて、かなり処理時間かかる MeshFlowというブレ補…

Keras Code examples 「Keypoint Detection with Transfer Learning」のダメそうなポイントのメモ🦔

Keras Code examples の「Keypoint Detection with Transfer Learning」と言うサンプルを改善しようとチマチマ眺めていたけど、無理っぽい気がしたので供養する投稿です Keras Code examples 結構好きなんですけど、キーポイント検出の内容はずっと気になっ…

GlobalFlowNetで動画のブレ補正をお試し🦔

ひとつ前の投稿で書いたVidStabが、いわゆるレガシーな画像処理的なブレ補正だとすると、GlobalFlowNetは、いわゆるDeep系なブレ補正です。 ブレ補正の性能は高いと思いますが、、、処理時間がかかるのと、GlobalFlowNetは画像を出力する際に画質が劣化する…

VidStabで動画のブレ補正🐦

VidStabというライブラリを使用した動画のブレ補正です。キーポイントマッチングとアフィン変換を使用した、いわゆるレガシーなブレ補正手法なライブラリです。 Deep系なアルゴリズムに比べて、処理速度が速い傾向があり、そこそこ補正できるような感じです…

MobileSAM と EfficientSAM も ONNX推論お試し👀

この投稿の続編です。 kazuhito00.hatenablog.com MobileSAM と EfficientSAM の ONNX推論お試しコードを以下にコミットしています。MobileSAMはSAMと同様に、公式リポジトリでエンコーダーのONNXエクスポートが無かったため追加しています。EfficientSAMは…

Segment Anything Model(SAM)をONNXに変換して推論🦔

本当はもっと早くやりたかったシリーズSAMが登場してから、もう1年たってるんですよね。。。 SAMは凄い良いモデルなのですが、、、公式リポジトリのONNXエクスポートとONNX推論周りのサポートはちょっとイマイチだと思っています。 どれくらいイマイチかと言…

YOLO-World-v2 の Gradioデモを Colaboratory上でお試し🦔

YOLO-World試そう試そうとは思ってたのですが、仕事がバタバタしてて、 今更触りました 気が付いたらv2になっていたわけですが、v1との違いは良く分からないなー 以下の動画の最後のほうの「hand」は頑張っているとは思いますが。 YOLO-Worldもv2になってた…

CLIP STUDIO PAINT(.clip)や Photoshop(.psd)のレイヤー画像の簡易ビューア📄

以下のツールをGUIでくるんだ簡易ビューアです 今回はGUIフレームワークにFletを使用しています。 ちょっと前?に話題になって、触ろう触ろうと思ってたのですが、今回初めて触りました。設計思想とかデザインとか結構好みな感じです 触ろう触ろうと思ってて…

クリスタのclipファイルから、レイヤー名や画像を取得するツール(非公式)🦔

表題の通りです。完全に趣味の産物ですが、いったん、それなりに動くところまで来たのでGitHubに公開しました github.com 昨日ザッと書き上げた時は、ブロックデータを画像に直す処理が結構遅かったのですが、本日何とか許容範囲(個人の感想です)になりま…

【Python】パワポのオートシェイプでQRコードを作るスクリプト

年始のLT資料に入れたQRコードです。 QRコード作成用のPythonスクリプトが、HDDのこやしになっていたので、供養もかねてZenn書きました🦔 zenn.dev

heron-blip-v1 を Colab で試してから2週間たっている、、、ですって、、、👀

仕事バタバタしてて、あっという間に2週間たってた、、、 v0に比べて性能が結構上がっている感あったのですが、、、 比較結果どっかなくしてしまった。。。 heron-blip-v1味見してる良い感じ https://t.co/Vs1Iy5TwJR pic.twitter.com/dui1kDfrGt — 高橋 か…

【NGK2024S】 それ、パワポですか?

LT

NGK2024S(名古屋合同懇親会 2024新年会)で発表してきましたえーっと、何年ぶりだっけ?オフライン開催でした。 LT大会はオフラインでやると非常に楽しいです。また、来れない方のために、コロナ禍で培った配信技術を生かしてハイブリッド開催となりました…

OpenCVのViTトラッカー味見👀

ViTトラッカーのPRを貰ったため、取り込んで動作確認してみました 結構早いですね。 精度も速度の割にかなり高い気がします。 ViTトラッカーのPR貰ったViTトラッカー結構早いなhttps://t.co/RwaX8LOm35 pic.twitter.com/2W00kJCxMu — 高橋 かずひと@闇のパワ…

LLaVA-JPをColaboratoryでお試し。

VLMは結構興味あって、案件やプライベート含めちょいちょい試しています 身も蓋も無いこと言うと、現時点ではGPT4V(要課金)の性能が図抜けているのですが、、、OSSで簡単に動かせるVLMも、turingmotors/heron や tosiyuki/LLaVA-JP など出てきていて、前提…

2023年振り返り

はじめに 12/29(金)に仕事納めしました(本業は28日、副業案件は29日) 冬休み中は、LT資料作ったり、いくつか試験的なプログラム作ったりかなー もうコレ書いているタイミングも大晦日でギリギリなのですが、2022年の振り返りをしたいと思います だらだら書…

Qiita:【Python】OpenCVでAudio読み込みお試し

OpenCV Advent Calendar 2023の10日目の記事です🦔 qiita.com