
AWS Transcribe でインタビューの文字起こしを試してみた
AWS Transcribeが最近日本語対応しましたね!
社内でのインタビュー録音が手元にあったので、これを使ってどのくらい文字起こせるのか試してみました。
環境
録音データ
・10分27秒
・6.3MB
・iPhoneのボイスメモで収録
・インタビュアー1人、回答者1人
・オフィス内で周りの人もバックグランドで話している状況
手順
1. AWS S3 にmp3ファイルを配置
2. AWS transcribe でジョブ作成
Language: Japanese
Input file location: S3のオブジェクトパス
これ以外はデフォ値のままいきました。
3. ジョブ実行
しばし待つ…
結果
3分で解析終了!速い!
気になる中身は…
まあ2人が交互とか同時にも喋ってるし、構文として正しい文章を話しているわけではないのでこんなもんですかね!手作業でのクリーンアップは必要でしょうが、これだけのボリュームを3分で処理してくれるならいいんじゃ…ないかしら…どうだろ
料金
0.0004USD/秒
今回は約0.25ドルなので30円弱でした。試用する分には無料利用枠で余裕です。