Molmoより先に試していたのですが、、、
Molmoが突如現れて、一部の認識機能(位置把握とかカウント能力)でちょっと衝撃的だったので、後回しにしてしまっていました。。。
一番小さいモデルで0.5BのVLMです。
ただ、Flash Attention採用してて、Ampereアーキテクチャ対応のGPU必要なので、Colaboratoryで動かすならL4以上じゃないとダメです。
そーいえば、Molmoが僕の中で話題をかっさらって言ってしまったので、後回しにしてしまっていたのですが、、、
— 高橋 かずひと@闇のパワポLT職人 (@KzhtTkhs) 2024年9月26日
PhantomってVLMを味見しています👀
一番小さいモデルで、0.5Bとパラメータ数は少ないモデルです。
パラメータ数が少ない割に推論時間はかかるのですが。。。🙄 pic.twitter.com/CECzcx5KRD
試したノートブックは以下にコミットしています👻