Phantom を Colaboratory でお試し🦔 - 高橋かずひとのプログラミング、その他、備忘録。

Molmoより先に試していたのですが、、、
Molmoが突如現れて、一部の認識機能（位置把握とかカウント能力）でちょっと衝撃的だったので、後回しにしてしまっていました。。。

一番小さいモデルで0.5BのVLMです。
ただ、Flash Attention採用してて、Ampereアーキテクチャ対応のGPU必要なので、Colaboratoryで動かすならL4以上じゃないとダメです。

そーいえば、Molmoが僕の中で話題をかっさらって言ってしまったので、後回しにしてしまっていたのですが、、、
PhantomってVLMを味見しています👀
一番小さいモデルで、0.5Bとパラメータ数は少ないモデルです。
パラメータ数が少ない割に推論時間はかかるのですが。。。🙄 pic.twitter.com/CECzcx5KRD
— 高橋かずひと@闇のパワポLT職人 (@KzhtTkhs) 2024年9月26日

試したノートブックは以下にコミットしています👻

github.com