PyCon mini 東海 2024で発表してきました & レポート

はじめに Pycon mini 東海 2024 でトーク発表してきました。今年は全然LTとか発表していなくて、ここでの発表で今年2回目でした。久々すぎて緊張しましたね。。。( ´ー｀)y-~~でも、オフラインの発表でしか出ない脳汁があることを再認識しました会場は、中…

2024-10-27

RT-DETRの改良モデル？ D-FINEをお試し🦔

物体検出 ONNX Colaboratory

「D-FINE は、DETR の境界ボックス回帰タスクをFDR として再定義し、GO-LSDを導入する強力なリアルタイムオブジェクト検出器であり、追加の推論およびトレーニングコストを導入することなく優れたパフォーマンスを実現します」とのこと D-FINE味見中https:…

2024-10-19

Janus-1.3B を Colaboratory でお試し🦔

Colaboratory VLM 機械学習

1.3B と言う軽さで、画像認識も画像生成も出来るJanusを味見しています。ただ、研究として異議はあるかもですが、運用として認識も生成もしたい状況ってないんですよねー。この構造のおかげで1.3Bと言う軽さに寄与している？性能は中々だと思います。ただ、…

2024-10-17

PINTO_model_zoo：人検出＋顔向き＋属性判定＋パーツ検出モデル（460_RT-DETRv2-Wholebody25）味見👀

機械学習物体検出 ONNX

PINTO_model_zooの秋の新作です人検出＋顔向き（水平方向）＋属性判定（おとな/こども、男女）＋パーツ（目、鼻、口、耳、右手、左手、足）の検出が出来るRT-DETRv2です。この系統のモデルは、PINTO_model_zooでYOLOv9で公開されてきていたのですが、RT-DET…

2024-10-15

OpenAI の Swarm で画像認識したり、処理の移譲をするメモ🐝

機械学習 Colaboratory VLM LLM OpenAI

以下を試したときのメモをZennに書きましたまあ、正直小細工ではあります。すぐにこんな小細工も必要ないくらいGPT進化すると思っていますが。。。 OpenAIのSwarmさんで画像認識を試しています。とりあえず、GPT-4o miniが苦手な座標取得を依頼された時に、F…

2024-10-12

RT-DETR(v2) を Colaboratoryでトレーニングするサンプル👻

物体検出 ONNX Colaboratory

以下の続きです。ちょっとymlファイルが多いですが、あまり癖のないトレーニングコードで、サクッとColaboratoryで動かせました RT-DETR(v2)をColaboratoryでトレーニングするサンプルも放流https://t.co/EuKfAaR701 pic.twitter.com/pIk8vY0rCk — 高橋か…

2024-10-12

RT-DETR(v2) を ONNX推論おためし👀

物体検出 ONNX

そーいえば、RT-DETR(v2)触ったことなかったな。と思って軽くお試しあー、CPU(Core i7-8750H CPU)だと思ったより早くて、GPU(GeForce GTX 1050 Ti)だと思ったより遅いな、、、いや、GPU古いってのもありますが、、、新しめのGPUだと速いんだろーなって雰囲…

2024-09-27

肌、服、髪セグメンテーションにイラストのデータセットを追加しトレーニング🦔

機械学習 Semantic Segmentation PyTorch ONNX

かなーり昔に作ったセグメンテーションモデルの続編ですね。元々目指していた方向性が、MediaPipeのSelfieMultiClassで達成できてしまうので、方向性を変えてイラストも追加して学習してみました。正直、精度はまだまだイマイチです。以下みたいな感じま…

2024-09-27

Phantom を Colaboratory でお試し🦔

Colaboratory 機械学習 VLM

Molmoより先に試していたのですが、、、Molmoが突如現れて、一部の認識機能（位置把握とかカウント能力）でちょっと衝撃的だったので、後回しにしてしまっていました。。。一番小さいモデルで0.5BのVLMです。ただ、Flash Attention採用してて、Ampereアーキ…

2024-09-26

Molmo を Colaboratory でお試し🦔

機械学習 VLM Colaboratory

VLMもじゃんじゃんリリースされますね。Apache2.0 の OSS で GPT4V より認識性能が高いらしいです GPUメモリ的にColaboratoryだとA100必須だけど、このVLMの性能は凄いな2枚目は可視化したものだけど、位置も良さそう pic.twitter.com/J4NvC7CrT5 — 高橋か…

2024-09-16

Phi3.5-Vision を Colaboratory でお試し👀

VLM Colaboratory

とりあえず動かしたノートブックです。ちょっと色々試す時間なかったので、いったん共有です👻 github.com

2024-09-12

Anime-Segmentation の ONNX を Colaboraotry上でお試し📚

機械学習 Semantic Segmentation ONNX Colaboratory

CartoonSegmentation触った関連と言うことで、Anime-Segmentation を触っています。ちょっとタスクは違いますが。。。（CartoonSegmentationはインスタンスセグメンテーション、Anime-Segmentation はセマンティックセグメンテーションによる前景抽出、のよ…

2024-09-11

SegGPT を Colaboratory でお試し🦔

機械学習 Semantic Segmentation Colaboratory

SegGPTを試しています。 SegGPTをColaboratoryでお試ししているリファレンス画像とマスク指定を用意して、対象物のセグメンテーションを行うモデルですね pic.twitter.com/syYtm4uYCr — 高橋かずひと@闇のパワポLT職人 (@KzhtTkhs) 2024年9月11日試すだけ…

2024-09-11

CartoonSegmentationOnnx を Colaboratory でお試し📚

Semantic Segmentation ONNX Colaboratory

CartoonSegmentation のオリジナルはmmcv関連のパッケージがインストール必要で、ちょっと環境構築が面倒だったのですが、ONNXに変換してくれているリポジトリがあったため、Colaboratoryで試してみました。 CartoonSegmentationのONNX助かるーオリジナルリ…

2024-09-08

暗闇補正のCoLIEをColaboratoryでお試し🌙

PyTorch 機械学習 Colaboratory

CoLIEと言うアルゴリズムのLLIEです。画像毎にtrain()を回して適応する仕組み上、現時点のONNX変換は不可ですただ、個人的な初見ですが、最近見たLLIE系の中では一番補正性能高いと思います。ただし、処理時間はそれなりに必要なので使いどころは考える必要…

2024-09-08

White-box-Cartoonization（TensorFlow1.x系モデル）を Colaboratory で実行🦔

GAN 機械学習 Colaboratory

生成AI全盛期の今では、正直あまり使いどころもありませんが、、、個人的にはWhite-box-Cartoonizationで変換された風景とか、味があって好きですもう4年くらい前のモデルだけど、今でも風景に対してのWhite-box-Cartoonizationの変換結果、味があって好きT…

2024-09-04

Qwen2-VLをColaboratoryでお試し🦔

機械学習 VLM Colaboratory

Alibaba が公開した Qwen2-VL を Colaboratoryでお試ししていますいくらか試していますが、かなり認識性能が高い気がします。多言語対応していて、日本語入力、日本語回答が出来るのもポイント高いですね。そういえば、オープンな重みで日本語入力、日本語…

2024-09-02

MediaPipe Python サンプルをレガシーソリューションから新ソリューションに更新🦔

機械学習物体検出姿勢推定 Semantic Segmentation MediaPipe

昔作ったサンプルのフルリニューアルです。 8ヶ月ほど遅いですが、レガシーソリューションから新ソリューションにリニューアルしましたtfliteファイルやtaskファイルをインスタンス生成時にロードする仕様に変わっているやつです。個人的には1枚目のSelfieMu…

2024-09-01

cloths_segmentationをONNXに変換してお試し🏃

機械学習 ONNX Semantic Segmentation

ある程度近い距離だと綺麗に抜けますね複数人とか遠いとかだとイマイチなので、人検出と組み合わせたりしないとですが。 4年くらい前のU-Netベースのモデルですが、衣服セグメンテーション味見している眼鏡は衣服か、、、アイウェアだしそうか、、、？ pic.t…

2024-08-30

Large Language Mario：VLMはやっぱり位置関係の把握が苦手🍄？

VLM 機械学習

苦手です ※2024年8月30日現在と言うか、前々から色々なVLMに対して言及されていた課題ではありますが、、、（特にGPT4Vで指摘されることが多い印象）お仕事でプロトタイプ検証した時も感じておりましたが、仕事の内容なので、はてブに書くわけにもいかず、…

2024-08-29

PythonでBrainfckのソースコードを生成して、BrainfckのソースコードをPythonで実行🙄

Zenn 雑記

難解プログラミング言語のソースコードを普通の言語で生成するという虚無👻 zenn.dev

2024-08-21

メモ：Colaboratoryで個人的に良く使うのに毎回ググったり探し回ったりしているもの

Colaboratory Zenn

完全に個人的なメモです。Zennのスクラップです。これ毎回ググってんな。。。とか、これ毎回GitHubで自分のリポジトリ検索かけてるな。。。みたいなやつを整理しています👀 zenn.dev

2024-08-20

MiniCPM-V2.6 を Colaboratory でお試し🔍

機械学習 Colaboratory VLM

MiniCPM-V2.6 は、単一画像、複数画像、動画などを処理できるマルチモーダルLLMです。個人的な感想ですが、この手のローカルで動かせるVLMで、複数画像や動画を処理できるものは珍しい気がしますね MiniCPM-V2.6は、公式の説明では以下のような特徴があるら…

2024-08-17

Florence 2 を Colaboratory でお試し🔍

機械学習 VLM Colaboratory 物体検出 Semantic Segmentation

Microsoft が公開している軽量VLMのFlorence 2をColaboratoryで味見しています。 Florence 2 は以下のようなタスクが実行できるモデルです。一般的にVLMで言う、フリーワードでのプロンプトではなく、タスクに応じたプロンプトの指定が必要です。 CAPTION：…

2024-08-17

MobileVLM V2 を Colaboratory でお試し🔍

機械学習 VLM Colaboratory

軽量なVLMのMobileVLM V2です。以下はシンプルなプロンプトですが、T4 GPUで約250msとかなり早いですそーいえば、MobileVLMも触りかけて放置してたのですが、Colaboratoryで改めて触りましたシンプルなプロンプトですが、T4 GPUで約250msと言うのは流石に早…

2024-08-16

Zennスクラップ：insightface と inswapper_128.onnx を用いてフェイススワップを行うColaboratoryノートブック

Zenn 機械学習

いわゆる顔交換ですねオリジナリティ等あんまないので、Zennスクラップ行きです。 inswapper でのフェイススワップこれに関しては完全に趣味だな、、、仕事じゃ絶対使わんし 1枚目：交換元画像 2枚目：交換先画像 3枚目：交換結果 pic.twitter.com/PdvrskzDK…

2024-08-16

nsfw_modelをONNXに変換して味見🦔

機械学習 ONNX Colaboratory

NSFW（Not Safe For Work：職場での閲覧注意）画像の判定ですNSFWと言ってもアダルト判定のみでグロとか暴力とかは対象外。やりかけで放置していたサンプルソースがポコポコ出てくる、、、これはNSFWモデルをONNX変換したもの。たしか一時期Stable Diffusio…

2024-08-16

MVANetをONNXに変換して味見👻

機械学習 Colaboratory ONNX

MVANetです。BiRefNetと同じくDIS（Dichotomous Image Segmentation）モデルです。あくまで、個人的な感覚ですが、BiRefNetの半分くらいの推論速度で、精度はそれなりと言う感じです重みファイルも半分くらい（約440MB）お試ししたソースコードは以下にコ…

2024-08-15

PINTO_model_zoo：雨除去（310_attentive-gan-derainnet）Pythonデモ追加

機械学習 ONNX

雨除去と言うか水滴除去ですかね後処理がちょっと珍しい感じです。性能はボチボチ？ 310_attentive-gan-derainnetちょっと珍しい後処理と言うか出力の補正が必要各チャンネルごとにスケーリング pic.twitter.com/eLjxGEmL17 — 高橋かずひと@闇のパワポLT職…

2024-08-14

BiRefNetをONNXに変換して味見👻

機械学習 ONNX Colaboratory

BiRefNetをONNXに変換して動作を味見しています。いわゆるDIS（Dichotomous Image Segmentation）モデルです。背景除去、背景分離、Salient Object Detectionとか呼ばれたりもする？Salient Object Detectionは違うか？ ONNX変換後の重みファイルが1GB弱あっ…

高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。　お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

PyCon mini 東海 2024で発表してきました & レポート

RT-DETRの改良モデル？ D-FINEをお試し🦔

Janus-1.3B を Colaboratory でお試し🦔

PINTO_model_zoo：人検出＋顔向き＋属性判定＋パーツ検出モデル（460_RT-DETRv2-Wholebody25）味見👀

OpenAI の Swarm で画像認識したり、処理の移譲をするメモ🐝

RT-DETR(v2) を Colaboratoryでトレーニングするサンプル👻

RT-DETR(v2) を ONNX推論おためし👀

肌、服、髪セグメンテーションにイラストのデータセットを追加しトレーニング🦔

Phantom を Colaboratory でお試し🦔

Molmo を Colaboratory でお試し🦔

Phi3.5-Vision を Colaboratory でお試し👀

Anime-Segmentation の ONNX を Colaboraotry上でお試し📚

SegGPT を Colaboratory でお試し🦔

CartoonSegmentationOnnx を Colaboratory でお試し📚

暗闇補正のCoLIEをColaboratoryでお試し🌙

White-box-Cartoonization（TensorFlow1.x系モデル）を Colaboratory で実行🦔

Qwen2-VLをColaboratoryでお試し🦔

MediaPipe Python サンプルをレガシーソリューションから新ソリューションに更新🦔

cloths_segmentationをONNXに変換してお試し🏃

Large Language Mario：VLMはやっぱり位置関係の把握が苦手🍄？

PythonでBrainfckのソースコードを生成して、BrainfckのソースコードをPythonで実行🙄

メモ：Colaboratoryで個人的に良く使うのに毎回ググったり探し回ったりしているもの

MiniCPM-V2.6 を Colaboratory でお試し🔍

Florence 2 を Colaboratory でお試し🔍

MobileVLM V2 を Colaboratory でお試し🔍

Zennスクラップ：insightface と inswapper_128.onnx を用いてフェイススワップを行うColaboratoryノートブック

nsfw_modelをONNXに変換して味見🦔

MVANetをONNXに変換して味見👻

PINTO_model_zoo：雨除去（310_attentive-gan-derainnet）Pythonデモ追加

BiRefNetをONNXに変換して味見👻