高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

LLaVA-JPをColaboratoryでお試し。

VLMは結構興味あって、案件やプライベート含めちょいちょい試しています👀

身も蓋も無いこと言うと、現時点ではGPT4V(要課金)の性能が図抜けているのですが、、、
OSSで簡単に動かせるVLMも、turingmotors/heron や tosiyuki/LLaVA-JP など出てきていて、前提や用途を限定すればかなり使える状況になってきました。

以下は、LLaVA-JPをお試ししている時に画像です。

 

お試しに使用したColaboratoryノートブックはZennの投稿と共に公開しています🦔

zenn.dev