【PR/文章術】度肝抜かれた。文字起こし自動化の大本命を見つけてしまった。
結論から書くと、もう、文字起こし自動化の夢が叶いました。
私の文字起こしに対する情熱は、こちらのnote「【PR/文章術】文字起こし自動化を求めて20年。ついに夢が叶うのか。」からご確認いただくとして。感動を早く伝えたいので本題からがっつり行きます。
試したのは、2020年9月1日にローンチされたばかりの「Rimo Voice」というサービス。日本語に特化したAI文字起こしサービスだそうです。
すごい。
すごすぎた。
・文字認識の精度がエグい
・漢字変換もほぼ完璧
・解析時間が短い
・再生、確認、編集すべてブラウザ上で可能
・文字起こしのニーズを分っている編集画面
・認識精度に不安がある箇所はグレー表示
・複数の声が重なる箇所も、精度は落ちるけどよく拾ってる
どれほどすごいのか。
Googleドキュメントに全文を貼り付けましたので、ぜひご覧ください。
音声と異なる箇所は「提案」でいれています。
文字起こし結果・全文
「【PR/文章術】文字起こし自動化を求めて20年。ついに夢が叶うのか。」で使ったものと同じ音声で試してみたところ、ほぼ正確。
解析後も音声を聞きながら確認・修正が容易に行えるし、ちょっとだけ早送り・巻き戻しできるボタンもあり、最後の仕上げまでここでできるという。文字起こしのことわかってる感ある。かゆいところに手が届きまくり。
もちろん、使用させていただいた動画「岸田奈美さん #noteのつづけ方2 」の岸田奈美さん、徳力基彦さんの話し方がとても聞き取りやすいという理由もあるのですが、それにしてもすごいなあ。
※ちなみにこの動画、文章書く人は必見です。
あと、個人的には、行間が美しくないと筆がのらない特性があります。テキストエディタも、行間が変更できるものでないとダメで。書いていて気持ち良いと思える入力画面はnoteくらいだったのですが、「Rimo Voice」も加わりました。気持ちいい。
文字起こしの未来は、コロナ禍で3年進んだ
4ヶ月前に「Gogole 音声文字変換」に感動していた私は、今年中にリリースされる予定の日本語版「Otter」の登場にほんのちょっとだけ期待しつつも、3年後くらいには文字起こし自動化の夢がかなうんじゃないかなー程度に思っていました。
そんなとき、Twitterのタイムラインに流れてきた本サービス。
コロナ禍で文字起こしサービスも多数生まれていたので「あとで試す」くらいにしか思っていなかったのですが、これが凄かった。度肝を抜かれました。
30秒20円の従量課金サービスということもあり、まだ一音声しか試していません。
ノイズがのっていたり、聞き取りにくい喋り方だったりするとまた違うのかなーとも思いつつ、おいおい実験していこうかなと思っています。
1時間2,400円。
精度さえ良ければ、気持ちよく払えるお値段感。
サービスの詳細はこちらから。
取り急ぎ。
興奮冷めやらぬままの、勢い任せのレポートでした。
文字起こしの未来は明るい!