隔離生活9日目の夜「Microsoftの会議文字起こしアプリ【Microsoft Group Transcribe】を使った感想」
はいええ、隔離生活9日目の夜でございます。
今回の話はそうですね
今朝お話したMicrosoftの会議文字起こしアプリ
「Microsoft Group Transcribe」ですね。
こちらをpodcaster目線で使って
ポッドキャスト配信の概要欄であったり、
テキストのブログの充実化を図ってみよう
と言うことをやった結果のご報告になります。
結果からいうとなかなか使えます。
文字の修正も少なく、
自動での改行や句読点なんかもあります。
今回私がテキストのブログを置く場所として
選んだプラットフォームというのは
noteと言うものなんですね。
皆さんは多分ご存知の方が多いかと思われます。
で、このnoteという媒体って
スマートフォンで読みやすいようにしましょうね
というのが公式のテキストで書かれてたりします。
つまりは、
縦型のディスプレイでの読者の想定をしましょうね
ということです。
結果としてではありますけれど
例えば改行であったりだとか、あと段落を分けたりだとか
っていうところを結構頻繁に行うんです。
それが、このアプリに非常にマッチしました。
はい、今ポッドキャストの録音で2〜3秒間を空けましたね。
この間をきちんと捉えてくれて
改行をしてくれます。
逆に今からずっとしゃべり続けると。
それが一つのまとまりになってしまいます。
つまり改行や句読点が
比較的自由に変えられるんですよ。
それがちょうどnoteの表示方法にマッチしているんだと思います。
ただし、
ちょっといただけないかなというところも
なくはないんです。
それが「話者とタイムスタンプが行ごとに表示されてしまうところ」
一応、このアプリはもともと
会議のリアルタイム文字起こしのためのソフトウェアです。
まあ、つまりは。
誰がいつ、何の話をしたのかっていうところの
文字起こしをする機能が
備え付けられているんですね。
会議の文字起こしであれば、
それは非常にありがたい機能です。
(これを利用すれば
「誰がどれだけその会議を支配していたのか(占有していたのか)」
というのもデータがとれますね。
逆に誰も参加していないのかも…
しかもこれ無料で使えるからね。
今のところ。
ゆくゆくはteamsに取り込まれるのかな?)
注意:この記事を作成した20220407現在の情報です。
ただですね
これを単純にリアルタイム文字起こしのために
使おうと思うとですね。
この部分。
「【タイムスタンプ】 【自分のハンドル】: 」
これらの文字列を削除しないといけないんです。
操作としては
ファイルに入ってあるすべての行の
半角スペース二つ目の所までの頭を消してやるという作業。
もしくはタイムスタンプと自分のハンドルの一致を削除
(僕は「[0-9]{2}(:[0-9]{2}) tacosu:」の方にしました)
正規表現を使えば一発で置換できる作業ではあるのですが、
正直面倒なことに変わりありません。
これの非表示というか
記入されないモードの追加してくれないかなぁ
と思います。
が、
用途が違うんだしお門違いでもあるかね
あと
もう一つ欠点をあげるとすれば
一つの連続した文字起しが可能なのは
30分が上限と言うところです。
一つのセッションにつき30分と言うことですね。
こちらは私のポッドキャストは長くても20分程度なので
なんとかなりました。
しかしながら、より長いものを扱う場合だと
途中でもう一度セッションを立ち上げ直さないといけません。
最近の日本のpodcastのはやりとして
10~15分程度のpodcastが増えているとはいえ、
それはそれ、これはこれ。
そんな時は録音自体で30分に一度休憩を挟むという形で
対処するというのもいいかもしれませんね
さて、最後に
まとめとして繰り返しになりますが、
Microsoft Group Transcribeは
確かに用途とは違うため違和感はありますが、
無料で使える音声認識、文字起こしアプリとして優秀だと感じます。
ポッドキャスト配信の概要欄であったり、
テキストのブログの充実化を図ってみようという用途において
十分実用できると思います。
まあ、あくまで無料の範囲内ですけどね。
有料でお金を払ってやれば、
これよりも良い機能をつけたものがおそらくあるでしょうが、
無料で遊べる範囲内と言いますか、
その中でいえば
これは非常にいいんじゃないかなと使ってみて思います。
自分の意図しないところで改行されたり、
句読点がついたりっていうところもありますので。
そこに関しては運用でカバーです。
ポップノイズを出さないように気を付けるぐらいの気持ちですね。
ええ、私も今あの目の前でね文字起こしされているのを見ながら
どこでためを作ったらいいんだろうか
っていうところを考えながら話すようになってしまいました。
ある意味聴きやすいですかね?
将来的にも
いい方向に転がっていけたらと思いながらの
Microsoft Group Transcribe
のご紹介でございました。なんか違うな。
ええと、そういうわけで明日最終日になります。
いろいろこみ上げる思いもありますが、
最後までよろしくお願いいたします。
健康とまた明日お会いしましょう。
ではでは
追記、
最近グーグルのスマートフォン
pixelシリーズの文字起しも気になっています。
録音したものをそのまま文字起しできるんだとか
すでに録音したファイルも
文字起こししてもらえるのかはわかりませんが、
非常に魅力的なのは間違いありません。
一度試してみたいものです。
また、pixelがその機能を載っけたと言うことは
iPhoneも将来的には似たようなものを搭載してくれるんじゃないか
という期待も出てきますよね。
今後とも注目していきたいと思っています。