見出し画像

メモ:AI文字起こし「Whisper」をローカルで使う方法

インタビューした音声ファイルの文字起こしはとにかく手間だ。なるべくならしたくないことの一つではないだろうか。

先日、無料の音声編集ソフト「Audacity」に関するニュースが目に入った。

それを見るとIntelから提供を受けて「Audacity」にAI機能が追加できるという。へー、なんか便利そう……と見てたら「Whisper」の名前が目に入ってびっくりする。AI音声認識技術の「Whisper」は、音声ファイルを解析して自動で文字起こしをしてくれるスーパーありがたツールなのだ。しかも多言語対応。

ただ、「Whisper 文字起こし」で検索すると、専門家以外嬉しくないような技術解説とか、Google Colab上で動かしてみよう!みたいなめんどくせーやり方ばかりが紹介されてて、文字起こしさえできれば仕組みはどうでもいいんだよ~というIT苦手系ライター業の人々に嬉しくない記事ばかりなのが気になっていた。

APIを経由すると有料なのも問題だった。そりゃ実行環境整えてGithubにあるオープンソースのを使えば「Whisper」は無料でローカルで使えたとはいえ、もっと手軽にやれないもんかと常々思っていた。そんなところにこのニュース。よーし、うちのnote読者が使うかわからんが解説しておこう。

ただし64bitのWindowsだけだ! LinuxとMacの読者は自分でソースをコンパイルする必要があるっぽいので、そんなことできる人はそもそもこの記事を読む必要なし! あとGPU必要なし! CPUを使う!


手順1・ファイルを揃える

ダウンロードしなくてはいけないファイルは3つ。

ここから先は

3,213字 / 11画像

¥ 200

この記事が気に入ったらサポートをしてみませんか?