VrewとiPadで時短文字起こし
◉noteにFacebookの記事をリンクできるようになったので、さっそく試してみました。『iPadだけで録音した音声の文字起こしをする方法を見つけた 2』より。Vrewとは、動画ファイルに自動的に字幕をつけてくれる人工知能動画編集アプリです。本来は文字起こし用のアプリではないのに、約1時間30分の動画の音声を文字起こしするのにかかった時間が、約3分20秒とのこと。その驚異の手法は下記リンクを読んでいただくとして。
自分もApple信者でタブレット型大好き人間ですから、Speechyを使っての文字起こしは昔やっていました。タッチタイピング(ブラインドタッチ)ができない自分は、昔から音声認識アプリには、並々ならぬ関心がありましたし。Speechyの変換精度は高く、ドラゴンスピーチや音声認識メール同様に、文字書きにも使っていたのですが。それよりも速く、別のメリットもあるようで。
◉…△▼△▼△▼△▼△▼△▼△▼△…◉
■文字起こしの基本形■
ライター仕事で、文字起こしはけっこう重要でして。インタビューした相手の録音を、文字起こしするのは日常茶飯事。自分の場合、録音ミスを防ぐため、ICレコーダーとiPhoneとiPadの、3種類を起動して録音することも多いです。iPadを使うと、Speechyなどを使っての文字起こしもスムーズですしね。ライター仕事をやり始めた当初は、ICレコーダーを何度も聞きながら、手打ちで文字起こししてました。
現在は、音声認識アプリがレベルアップし、ICレコーダーの音声を直接文字起こしすることも可能になりましたし、Speechyなどを使っての文字起こしも。ただ、音声認識の精度に関しては、Googleが一気にレベルアップし、Androidタブレット系での音声認識がiPhoneやiPadでのそれを頭ひとつどころか1馬身ぐらい抜け出した感じでしょう。このため、文字起こしにも変化が起きています。
自動的に変換するより、録音データをヘッドフォンで聴きながら、自分の口でしゃべって、Edivoiceなどで音声認識させた方が、早くて正確と言うことに。どうせ掛かる時間は録音時間に比例するので、コッチが手っ取り早いんですよ。でも、時間がここまで圧縮されるなら、話が違います。
■リアルタイム認識でなくてもいい■
しかし、ここまで音声データを短時間で文字起こしでき、しかも音節の切れ目ごとに改行してくれるなら、使い勝手はメチャクチャ良いでしょうね。例えば、ウチの講座の一部は動画が撮影していますし、コロナ禍以降はzoomを利用したオンライン講座に移行しているのですが、コチラは全部の講座を録画しています。zoomには録画機能があるので、ボタンひとつで音声と画面を録画が可能に。
この、Vrewを使えば、長大な講義(だいたい毎回3時間がデフォルトで、オマケの講義を加えると6時間や8時間も)が、一気に圧縮できそうです。文字起こしの時間が長ければ長いほど、使う意味や価値が出てきますね。というかこのアプリ、ちょっと応用すれば文字起こしアプリとして専用のサービスができませんかね? 字幕アプリだけに限定するのは、もったいないです。
確かに情報管理の面で、動画をアップロードするのに抵抗がある人もいるでしょうけれど。個人的には、こういうアプリの普及や洗練は、止まらないと思っています。なお、前述したAndroid系タブレットを使っての音声認識、エンジンは同じGoogleでも、インターフェイスはこのEdivoiceがもっとも使い勝手が良いので、オススメします。適度にボタン操作を加えた方が、効率が良くなる典型例のアプリです。
■音声認識のブレイクスルー■
こういうアプリやサービスが普及すると、昔ながらの文字起こしサービス自体が、なくなったり先細るんでしょうけれど。ほとんどの作業がiPadで完結するってのが大きいですね。しかも、サービスの内容からいっても、iPad ProやiPad Airでなくてもいい、無印iPadやiPad miniでも大丈夫でしょう。5G通信が普及してWi-Fiとの速度差がなくなれば、もうiPadは究極のパソコンになるでしょう。
個人的には、音声認識の精度がどんどん上がって、ほぼ商用レベルで使えるってのも、大きいですね。昔はViaVoiceでも不満が残る認識精度で、音声認識は90%の変換精度でも使えないなと思ったものですが。もちろん、自分の滑舌の悪さもあるんですが。それが今では、ほぼ問題なし。AIの発達とかも含めて、本当に使えるパソコンの時代なんだなぁ……と。感慨深いです。
なお、noteにFacebookの投稿を埋め込む記事については、こちらをどうぞ。noteもどんどん利便性が上がっているので、是非とも記事が飛ぶ不具合についての善処をお願いしますm(_ _)m