ボイスメモ「speechy」を使って、早口言葉をどれくらい読み取れるか。
フリーライターの舘澤です。ボイスメモ「speechy」というアプリを使って「口述筆記で、どこまでライティング業務を効率化できるか」に取り組んでいます。移動中や家事・育児などの片手間に「語る仕事日誌」として活用していきますね。
今日はあんまり急いでやる仕事もないので、早口言葉を使った、speechyの読み取り機能をがっつりチェックをしてみたいと思います。
【実際やってみた結果】
隣の客はよく柿食う客だ
隣の客はよく柿食う客だ
隣の客はよく柿食う客だ
バスガス爆発バスガス爆発バスガス爆発
坊主が上手に屏風に笑を描いた
坊主が上手に屏風に笑を描いた
坊主が上手に屏風に笑を書いた
東京特許許可局東京特許許可局東京特許許可局
赤巻紙青巻紙黄巻紙赤巻紙青巻紙黄巻紙
生麦生米生卵生麦生米生卵生麦生米生卵
※改行して見やすくした意外は手を加えていません。
【感想】
「坊主が上手に屏風に笑を描いた」の「絵」が何度やっても「笑」になっていることを除けば、全て正しく読み取っています。
中には、私がうまく言えていない部分もあるのですが(東京特許許可局はほぼ言えてない)、AIが早口言葉を記憶していて、「あー、こいつ上手く言えてないけど、これを言いたいんやな」と補ってくれているのでしょう。この辺が、他の自動文字起こしとは違うところだと思います。
ということは…ここで一つ気付いたことが。もしかして、何度やっても上手くいかなかった「坊主」の早口言葉は、そもそも私の記憶違いなのかも。
調べてみたところ、やはりその通りで、正しくは「坊主が上手に屏風に坊主の絵をかいた」でした。
再チャレンジしたところ、パーフェクト。「絵」の部分を「笑」とする事はありませんでした。むしろ、多少舌がもつれてうまく言えなくても、正確に読み取ってくれました。
speechyには携帯で文字入力する時に補足してくれるサジェスト機能と同様のものが積まれていて、それが喋る端から、適切なのを選びとっているのだと思います。
【応用編】
昔バラエティー番組の「ガキの使いやあらへんで」のコーナーで、外国人に「掘った芋ほじくるな」と言ったら、「what time is it now」に聞こえるか?という実験がありました。
あれと同じように、全然言えてなかったとしたら、どうでしょうか?speechyはどこまで読み取ってくれるのでしょうか?
実験では、早口言葉が大の苦手な妻にお願いして話してもらいました。
※上の文章は妻が口にした文章。下はspeechyが読み取ったテキスト。
とうちょうとっちょちょちゃちょく
↓
東京特許許可局
あおまちがみあかまちだみちまちがみ
↓
青巻紙赤巻紙黄巻紙
となりの柿はよくたきちゅうかきゅだ。
↓
隣の客はよく柿食う客だ
素晴らしい。
【結論】
早口言葉は無双。
言えてなかったとしても、文字順が正確で熱意があれば、かなりの部分を補ってくれる。1度ではなく、2度、3度、繰り返すとなおよし。
【これから調べてみたいこと】
・早口にどれくらい対応できるか
・専門的なワードにどれだけ対応できるか
・擬音語とか擬態語とか、どれくらいいけるか
・複数人の言葉をどれだけ受け付けられるか
・舌足らずでも読み取ってくれるか
・どれくらい距離を開けても読み取れるか。など
今日は、何回も録音して取り込んで編集して、という作業を繰り返していたこともあり、全部で1時間ぐらいかかってしまいました。仕事日誌はまた明日!