ベトナム語を自動で文字起こししようと色々やってみたメモ
noteでまとめるような内容では無い気がするんだけど...色々やってみたのでまとめがてら供養。
進行中のまとめです。(2020/11/19)
ベトナム語を自動で文字起こししたい
自分が目指したのは
・ファイルから(マイクからの直接入力ではない)
・欲しい精度は8割くらいで
ファイルは一応ノイズ除去済み(Krisp使用して収録)
mmhmm 使って動画収録 → 動画ファイルから音声抽出→文字起こし
をしたかった。
選択肢
・グローバル系
Google:Docs上音声入力+仮想オーディオデバイス
→ファイルからはできない...
Alibaba:Intelligent Speech Interaction
Azure:Speech to text
Google:Cloud Speech API
AWS:Transcribe
・ベトナム系
Viettel:Nhận dạng tiếng nói
FPT:Speech to text
VAIS:ORIGIN NOTE
状況
Alibaba:Intelligent Speech Interaction (これから試す)
ベトナム語有り。9月に追加したばかり。
60分1USD、使った分だけ課金
Azure:Speech to text (対応無し)
ベトナム語無し(Wordの音声入力はあり?)
Google:Cloud Speech API (対応有り、精度悪い)
ベトナム語あり。各ファイルは60秒未満。
Google Docsの音声入力精度と比べ物にならず。
AWS:Transcribe (対応無し)
ベトナム語無し
・ベトナム系
Viettel:Nhận dạng tiếng nói (精度良い、販売パッケージが...)
WEBでお試しできる。精度は8割くらい。結構良い。
8分のファイルをまとめてアップ→文字起こしできた。
120万秒=333時間強が1200万VND=5万4千円くらい。
60分で161円の計算だけど...30日間のチケット。
そんなに使わないよ...
FPT:Speech to text (お試し中)
WEBでお試しできる。けどファイルは20秒限定。
精度はViettelの方が良く感じる。
→違いました。[月60分まで無料。1万分=166時間強までで月140万VND=6300円程度。]
年60分無料...orz。全体的に大分高くなってるやんけ...
VAIS:ORIGIN NOTE (これから?)
WEBお試し無し。モバイルアプリあり。
ベトナムの国会で導入されてるみたい。
個人での利用は難しいかな...
その他ベトナム系サービスいくつか目にしてるので、試したらまた更新します。