whisperを使う

OpenAIが作った音声を文字に変換するツール、whisperを使ってみる。
プログラムは簡単。下記の5行のみ。
smallはちょっと精度が悪い。largeにすると精度が良くなる。
colabで使うと自分のパソコンが汚れなくてすむ。
事前に音声ファイルをアップロードしておくとよい。
かなり精度良く文字起こしができる。
 
 
 
import whisper
 
model = whisper.load_model("small")
result = model.transcribe("j2.m4a")
print(result["text"])