高橋かずひとのプログラミング、その他、備忘録。

日々調べてたことや、作ってみたものをメモしているブログ。 お決まりの断り文句ですが、このブログに書かれている内容は個人の見解であり、所属する組織の公式見解ではありません。チラ裏。

音声認識

Voxtral-Mini-3B の文字起こしを Colaboratory でお試し🦔

Voxtral-Mini-3B を味見しています3Bでありながら、それなりのチャット性能を持ち、テキスト+オーディオへの回答や、文字起こしなども出来るモデルです。3Bの他に24Bも公開されていますが、fp16でGPU RAMが55GB必要らしいので、僕の扱える環境では動かすこ…