高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

PINTO_model_zoo:人検出+深度推定(473_HISDF)をGradioアプリ化して味見👀

人検出+属性検出+深度推定のマルチタスクモデルです👀
Gradioアプリ化してColaboratoryで実行🦔
T4 GPUだと少し苦しいか、5fps(選択したモデルのサイズにもよる)

 

今回のモデルは以下。
Gradioアプリがコード量多い、かつ、Model Zooのデモとしてはちょっとふさわしくないかなー。ということで、外部リポジトリにコミットしてリンクです。

github.com

PINTO_model_zoo:人検出+視線推定(474_Gaze-LLE-DINOv3)をGradioアプリ化して味見👀

視線推定の味見です。
今回はGradioアプリ化してColaboratoryで実行🦔
T4 GPUとかでもギリ10fpsとかでますね(選択したモデルのサイズにもよる)

 

今回のモデルは以下。
Gradioアプリがコード量多い、かつ、Model Zooのデモとしてはちょっとふさわしくないかなー。ということで、外部リポジトリにコミットしてリンクです。

github.com

Qwen3-VL を Colaboratory でお試し🦔

Qwen3-VL を味見👀

Qwen2-VLやQwen2.5-VLも性能高くて良かったのですが、
Qwen3-VLは、多様なタスク(2D物体検出や3D物体検出、OCRなど)をサポートし、日本語性能も高いので大変良いです。
また個人的にはT4 CPU(2B、4B、8Bあたり)で動くのがポイント高いです。

 

試したノートブックは以下にコミットしています🦔

github.com

 

---

 

おまけ↓

からあげさんのLarge Language Marioプレイ

 

 

PyCon mini 東海 2025で発表してきました & レポート

はじめに

PyCon mini 東海 2025トーク発表してきました。

最近は、お世話になってたいくつかの勉強会が休眠状態になっていたり、プライベートがバタバタしていたりで、Pycon mini 東海、Pycon mini Shizuoka、NGKの3つだけ参加することが多いです。
あ、今年は登壇じゃないけど、つくろがや!3 にも出展しましたね👀

登壇から登壇の間が空くと、結構緊張するんですよねー。。。( ´ー`)y-~~

 

会場は、昨年に続き、中日ビルのカンファレンスルームでした。
アクセス良好、綺麗、そして、喫煙室がカンファレンスルームの間近にあって喫煙者の方に優しい。

そして、スタッフ皆様方、本当にお疲れ様でした。ありがとうございました🦔

今年も弁当が豪華!
私は昨年と同じ弁当を選んだのですが、今年は種類が増えて2種類から選択できると言うおもてなしぶりでした。

自分の発表について

「PyScriptとOpenCVを使ってWebで画像処理AI」と言うタイトルで発表してきました。
資料は以下にアップロードしています。

今年はスライド&デモはMarpを使用して作成していて、GitHub Pagesにアップロードしたものを使用してプレゼンテーションをしました。
「Marpの使い方、頭おかしい」いただきました👻

GitHub

github.com

GitHub Pages

画像をクリックするとスライド公開ページへ飛びます。

posfie

今年もにっきーさんによって、まとめられていました。
超助かるー🦔

posfie.com

 

セッション感想

全時間帯でトークを聴講していました。
ワークショップも気になってたのですが、体は一つしか無いので、別会場の発表を聞けないのはカンファレンスのさだめ。。。

 

キーノート:教育・研究現場で活用されるPython

教育・研究現場で活用されるPython

Ruby KaigiのTシャツを着て登壇していたり、Rubyのステッカーをお土産で配りだしたりするという暴挙w


島根の高専という環境下でPythonが結構使われている(高専としてはカリキュラムでRubyを教えていてPythonは教えていないにも関わらず)お話は大変興味深かったです。

もともと高専には意欲的な生徒が多く、自分のやりたいことや卒研から逆算して、必要に応じてPythonを独学で習得されるようです👀

 
個人ではじめるマルチAIエージェント入門 〜LangChain × LangGraphでアイデアを形にするステップ〜

speakerdeck.com

試されたことがステップバイステップで解説されていました。

うまくいったこと、うまくいかなかったこと、試行錯誤が良く分かって勉強になります🦔

 

Pythonでやってはいけないやってみるべきこと

資料まだアップロードされていないかも?

Pythonの仕様を良くない使い方&黒魔術して、会場を沸かせる天才的な発表でしたw
資料も大変面白いのですが、これはトーク込みで完成するやつです。

「`__class__` を変えるとどうなる?」
仕事でやったら、ど叱られると思うのでやってはいけません👀

 

APIのテストデータを自動生成できるSchemathesisの紹介

introduction-to-schemathesis.ryu22e.dev

いわゆるプロパティベーステストのお話です。
ツールの使い方から、はまりどころ、Tipsなど紹介されています。
ちょっと私もどこかで試してみたい👀

 

稼働中のバッチアプリケーションを依存性逆転の法則でモダナイズ - 型安全と堅牢なテストによるリプレイス戦略

資料まだアップロードされていないかも?

他の言語でも存在する問題だと思いますが、研究用のコードと実運用のためのコードのお話。

データ分析や機械学習で使われることが多いPythonは他の言語よりも、この問題にぶちあたるかもですね。
生々しい失敗例など解説されており大変勉強になりました。

 

型でつなぐFastAPI × フロントエンド活用術

www.docswell.com


Webフレームワークの比較、OpenAPIからTypeScriptクライアントを自動生成する方法など解説されていました。
最近はTypeScriptいろいろな場面で使うので、ちょっと改めて勉強したいです👀

 
Pythonで構築する人口移動ナレッジグラフ: GraphRagを用いた意味的地域検索への応用

speakerdeck.com

GraphRAGのお話👀

市町村データセットの内容や使い方も説明されていて、これは手を動かして試したい🦔

 

以上。

X(旧Twitter) で クリックすると画像が変わるやつを作るPythonスクリプト🦔

こんなやつ👀↓
Xのサムネイル表示時は白背景で、クリック後は黒背景になることを利用したトリック画像ですね(もちろんダークモードだと動かない)書い

 

一度自分で作ってみたかったのでPythonで生成してみました🦔

試しに投稿してみたものはこちら↓

 

ちなみにChatGPTさんに見せるとこうなる↓

 

今回作ったスクリプトは以下にコミットしています↓
大部分をGemini CLIにおまかせですが👻

github.com

DEIMv2 の ONNX変換 と Colaboratory上でのトレーニング👀

性能が良い物体検出モデルDEIMのv2です。
個人的には以下の表のとおり、AttoやFemto、Picoなど超軽量系のラインナップがあるのが凄く好みです🦔

 

直近で使う予定はないのですが、使いたくなった時にすぐ使えるように、
いつも通りONNX変換とColaboratory上でのトレーニング用のリポジトリをコミットしています🦔

github.com