ノンプログラマー向けAmazon Transcribeを使った文字起こしの方法

2020年6月25日 13:27

この記事はblog内容をベースにNote用に短縮して作成しております。
詳細はblog記事【ノンプログラマー向けAmazon Transcribeを使った文字起こしの方法】をご確認ください。

読んで欲しい人

・Amazon Transcribeに興味がある
・文字起こし機能を自分で実装するほどではないけど、使ってみたい
・議事録作成、インタビューの文字起こしに疲れている人
・mp3/mp4/wav/flacファイルの文字起こしをしたい人
・S3に音声データを保管している人

Amazon Transcribeとは、AWS（Amazon Web Service）で提供されるサービスの１つで、自動で文字起こしをしてくれるサービスです。

2019年11月頃に日本語対応して話題になりました。自動音声認識で、音声ファイルや動画ファイルの文字起こしをしてくれます。

認識精度の違いはあるにせよ、両方とも音声ファイルなどを文字起こししてくれるという意味では同じです。

違いとしてあるとすれば、Amazon TranscribeはGCP speech to text APIと違いGUI（画面で操作すること、 graphical user interfaceの略）を提供しており、スクリプトを書かない人でも利用が容易です。

まぁAPIじゃなくてGUIを用意してるあたりがAWSっぽいといえば、っぽいですね。

使い方は至ってシンプルです。以下のステップで実行可能です（AWSに慣れていない人はわかりにくいかもしれませんが、ご容赦ください）

1. AWSにログイン（rootでもIAMユーザでも権限があればどちらでもOK）
2. S3にバケットを作る
3. S3のバケットにファイルをアップロードする
4. Amazon Transcribeでjobを作成する
5. 文字起こしが完了するのを待つ

使い方の詳細はblog記事でご覧ください