ゆるプロ!番外編「Whisperで音声認識して翻訳してもらう」
ゆるいプログラミング講座、略して「ゆるプロ!」
これは気軽に気楽に試せるゆるーいプログラミング学習コンテンツである。今回のお題は「Whisperで音声認識して翻訳してもらう」
一言)
前回の記事より、音声認識したファイルを翻訳してもらった。Whisperには翻訳機能もあるので実行した
飯坂温泉は、大湯、東北、地方有数の固湯であり、 古くはサバコの湯と呼ばれました。
例)Whisperで音声認識して翻訳してもらう
import whisper
model = whisper.load_model("medium")
result = model.transcribe("rec.m4a", fp16=False, language="ja",task="translate")
print(result["text"])
結果)
Iizaka Onsen is a very rich and rich lake in the northeastern part of the Ouu River. It was called the Sabako-no-yu in the old days.
bing翻訳にかけるとこんな感じ。流石に音声認識の段階で出来上がったテキストに依存はしたが、通じなくはないと思う。
参考)
OpenAI Whisper Github
参考にしたブログ
おわり!