高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

Qwen2-VLをColaboratoryでお試し🦔

Alibaba が 公開した Qwen2-VL を Colaboratoryでお試ししています👀
いくらか試していますが、かなり認識性能が高い気がします。
多言語対応していて、日本語入力、日本語回答が出来るのもポイント高いですね。

 

動画の処理も可能なのですが、、、
かなりGPU RAMが必要なので、強めのGPU用意必須です。
ColaboratoryのサンプルではT4 GPU前提で作成していて、動画は冒頭5秒のみ1fpsでの処理で動かしています。

 

今回お試ししたノートブックは以下にコミットしています🦔

github.com