メモ：AI文字起こし「Whisper」をローカルで使う方法

2024年2月9日 02:53

インタビューした音声ファイルの文字起こしはとにかく手間だ。なるべくならしたくないことの一つではないだろうか。

先日、無料の音声編集ソフト「Audacity」に関するニュースが目に入った。

それを見るとIntelから提供を受けて「Audacity」にAI機能が追加できるという。へー、なんか便利そう……と見てたら「Whisper」の名前が目に入ってびっくりする。AI音声認識技術の「Whisper」は、音声ファイルを解析して自動で文字起こしをしてくれるスーパーありがたツールなのだ。しかも多言語対応。

ただ、「Whisper　文字起こし」で検索すると、専門家以外嬉しくないような技術解説とか、Google Colab上で動かしてみよう！みたいなめんどくせーやり方ばかりが紹介されてて、文字起こしさえできれば仕組みはどうでもいいんだよ～というIT苦手系ライター業の人々に嬉しくない記事ばかりなのが気になっていた。

APIを経由すると有料なのも問題だった。そりゃ実行環境整えてGithubにあるオープンソースのを使えば「Whisper」は無料でローカルで使えたとはいえ、もっと手軽にやれないもんかと常々思っていた。そんなところにこのニュース。よーし、うちのnote読者が使うかわからんが解説しておこう。

ただし64bitのWindowsだけだ！　LinuxとMacの読者は自分でソースをコンパイルする必要があるっぽいので、そんなことできる人はそもそもこの記事を読む必要なし！　あとGPU必要なし！　CPUを使う！

手順1・ファイルを揃える

ダウンロードしなくてはいけないファイルは3つ。

ここから先は

3,213字 / 11画像

¥ 200

ログイン

この記事が気に入ったらチップで応援してみませんか？