高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

Janus-1.3B を Colaboratory でお試し🦔

1.3B と言う軽さで、画像認識も画像生成も出来るJanusを味見しています。
ただ、研究として異議はあるかもですが、運用として認識も生成もしたい状況ってないんですよねー。この構造のおかげで1.3Bと言う軽さに寄与している👀?

性能は中々だと思います。
ただ、Flash Attention2必須なので、ColaboratoryだとL4以上のGPUが必要です。

 

公式のサンプルを少し整理して動かしただけですが、ノートブックは以下にコミットしています。

github.com