Stream用字幕ファイル変換の3ステップ(SRTからVTTへ)
こんにちは。ケイ・エム・ディ・エス 業務プロセス改善推進グループ(KMDS BPMG)です。
今回は、Microsoftの動画再生ツール Stream のトランスクリプト(字幕)ファイルについてです。
Teams録画やStreamによる自動生成では、精度が低いため、別のツールを使って文字起こしをする場合があると思います。
そういうツールでは、多くの場合、文字起こしファイルは拡張子が .srt のSRTファイルとして出力されます(SubRip Text)。最近BPMGでは Vrew を使い始めていますが、出力はSRTファイルです。これに限らず、MicrosoftのClipchampでもSRTで出されますね。
ところがStreamでは、拡張子 .vtt のWebVTTファイルでアップロードしなければいけません。(Video Text Tracks)
ちょっと調べたところ、WebVTTの方が、SRTよりも色々な情報を埋め込める形式らしいですね。
それはともかく、SRTからVTTのファイル変換をどうすれば良いのでしょうか?始めた頃はよくわかっておらず、ああでもないこうでもないと、こねくり回していました。が、やり方は以下の3ステップだけです。簡単ですので覚えておきましょう。
1.ファイル拡張子を.srtから.vttに変える
メチャクチャ簡単ですね。
・・・ところで、まさかとは思いますが、ファイル拡張子を非表示になんてしてませんよね?
念のため、表示のさせ方は、
ファイルエクスプローラー ➡ 表示 ➡ 表示 ➡ ファイル名拡張子
です。
2.先頭にWEBVTTと付ける
これもカンタンです。ファイルを開いて先頭にWEBVTTと入れ、改行も入れてください。ファイルは、メモ帳やVS Codeなどのテキストエディターで開くのが良いと思います。
3.カンマをピリオドに置換する
最後にカンマ(,)をピリオド(.)に置換しましょう。SRTファイルでは、ミリ秒の区切りがカンマなのですが、VTTファイルではピリオドなのです。
置換には、メモ帳もしくはVS Codeの検索と置換機能が使えます。これで一括置換して、保存すればオッケーです。Streamにアップロード出来るファイルになりました。
ちなみに・・・英語の場合は、本文でもカンマが使われていますよね。ですから、上記のやり方では本文中のカンマもピリオドに置き換わってしまいます。
ということで、英語の場合は、正規表現を使って検索と置換を行いましょう。「数値に挟まれたカンマ」をマッチングさせる正規表現は、以下の通りです。
(?<=\d),(?=\d)
これは、VS Codeでやっています。
これで完了です。
StreamがSRTファイルでのアップロードにも対応してくれればいいのに、、と思いますが、このように簡単なので良しとしましょう。
以上、とってもお手軽な文字起こしファイルの変換方法をご紹介しました。
今回の記事が気に入ったら、スキ・フォローお願いします!
KMDS BPMG