見出し画像

自動文字起こしをやってみた

ちょっとしたライティング的なこともやっているので、ずっと気になっていた「自動文字起こし」に挑戦した。

「他人がとあるお店にインタビューした音声データ」を記事化しなくてはいけなかった。インタビュー記事を書いたことがある方なら分かると思うのですが、自分が現場にいなかった時の音声データを聞く時間って、ものすごく手前で時間が勿体無い・・・と思ったので、効率化にチャレンジ。

参考にさせていただいたのは、このnoteの記事。

まず使ったのは「SoundFlower」。MacのOSがSierraになったことによる諸々の不具合から、このサイトにもお世話になったりして、無事にインストールでき、早速挑戦したのがこの結果です。

「はいはい」という文字が羅列される・・・・(多分、インタビュアーのあいづち)。約40分の音声データ、ずっとこの画面を見ながら「はいはい」が並ぶのを見ていて、我慢の限界!!!!(笑)

なので、次に「writer.app」に挑戦。その結果がこちらです。

こっちは改行もされるからありがたいし、他のページ見てたりしても勝手に文字起こししてくれるから楽!しかし、こちらも「はいはいはい」が続く・・・。インタビュアーの声がでかすぎて、それしか入ってこない事実。音声データを聞いていないので、この「汚い心に。」が何なのか、気になりまくる。(これって、ショップのインタビューだよね???)

ということで、やはり改めて音声データを聞いてみると、ツールの「聞き間違い」が爆笑レベル。

「大阪府と戦った人は。」←大阪の話は一切出てこなかったんですけど

「東京にでも1年ぐらいで悟空がいたので」←東京に居たの?!

「お店なのかビールなのか」←ツールはお酒を飲みたがってますが、正解は「お店なのかビルなのか」でした

「天皇仕事大変だけど。」←いつの間にか天皇にインタビューしてた。正解は「派遣の仕事大変」でした


・・・とまあ、笑える結果になりました。精度、30点!(笑)

でもこれって、音声データの問題と、話す人の訛りとか方言も影響しますね。勉強になりました。ツールの癖さえ理解すれば、もうちょっと使い勝手よくなるかな・・・・?インタビューも、これから気をつけよう。

この記事が気に入ったらサポートをしてみませんか?