AWS Transcribe でインタビューの文字起こしを試してみた

2019年11月27日 11:01

AWS Transcribeが最近日本語対応しましたね！

社内でのインタビュー録音が手元にあったので、これを使ってどのくらい文字起こせるのか試してみました。

環境

録音データ
・10分27秒
・6.3MB
・iPhoneのボイスメモで収録
・インタビュアー1人、回答者1人
・オフィス内で周りの人もバックグランドで話している状況

1. AWS S3 にmp3ファイルを配置

スクリーンショット 2019-11-27 9.59.03

2. AWS transcribe でジョブ作成

スクリーンショット 2019-11-27 9.43.34

Language: Japanese
Input file location: S3のオブジェクトパス
これ以外はデフォ値のままいきました。

3. ジョブ実行

スクリーンショット 2019-11-27 9.44.56

しばし待つ…

スクリーンショット 2019-11-27 9.51.14

3分で解析終了！速い！

気になる中身は…

スクリーンショット 2019-11-27 9.52.01

まあ2人が交互とか同時にも喋ってるし、構文として正しい文章を話しているわけではないのでこんなもんですかね！手作業でのクリーンアップは必要でしょうが、これだけのボリュームを3分で処理してくれるならいいんじゃ…ないかしら…どうだろ

0.0004USD/秒

今回は約0.25ドルなので30円弱でした。試用する分には無料利用枠で余裕です。

スクリーンショット 2019-11-27 10.54.17