メモ:AI文字起こし「Whisper」をローカルで使う方法
インタビューした音声ファイルの文字起こしはとにかく手間だ。なるべくならしたくないことの一つではないだろうか。
先日、無料の音声編集ソフト「Audacity」に関するニュースが目に入った。
それを見るとIntelから提供を受けて「Audacity」にAI機能が追加できるという。へー、なんか便利そう……と見てたら「Whisper」の名前が目に入ってびっくりする。AI音声認識技術の「Whisper」は、音声ファイルを解析して自動で文字起こしをしてくれるスーパーありがたツールなのだ。しかも多言語対応。
ただ、「Whisper 文字起こし」で検索すると、専門家以外嬉しくないような技術解説とか、Google Colab上で動かしてみよう!みたいなめんどくせーやり方ばかりが紹介されてて、文字起こしさえできれば仕組みはどうでもいいんだよ~というIT苦手系ライター業の人々に嬉しくない記事ばかりなのが気になっていた。
APIを経由すると有料なのも問題だった。そりゃ実行環境整えてGithubにあるオープンソースのを使えば「Whisper」は無料でローカルで使えたとはいえ、もっと手軽にやれないもんかと常々思っていた。そんなところにこのニュース。よーし、うちのnote読者が使うかわからんが解説しておこう。
ただし64bitのWindowsだけだ! LinuxとMacの読者は自分でソースをコンパイルする必要があるっぽいので、そんなことできる人はそもそもこの記事を読む必要なし! あとGPU必要なし! CPUを使う!
手順1・ファイルを揃える
ダウンロードしなくてはいけないファイルは3つ。
ここから先は
3,213字
/
11画像
¥ 200
この記事が気に入ったらサポートをしてみませんか?