【私が使う音声認識ツール】聴覚障害のある大学3年生、やまもん。
お久しぶりです!
実は、様々な音声認識ツールを用いて、聴覚障害のある方や、ない方と一緒にお話する機会がありました。
4、5種類くらいの音声認識ツールを試しましたー!
そこで得たことや気付いたことを書きます!
やまもんの聴こえ方
以前、↓の記事を執筆しました。
聴者の平均的な聴力を0dB(デシベル)とすると、
私の聴力は10年ほど前の測定結果だと、
です。
数年前に測定した結果だと、スケールオーバー(測定不能)していました。
年々聴力は悪くなってますね〜。
100dBの聴こえは、ガード下にいても電車の音が聴こえるか聴こえないか、だそう。
以前、飛行機の中で補聴器外したらエンジン音も何も聴こえなかったなぁ。
補聴器を装用すると音は聴こえるが…
話し声は聴こえます。
が
内容は分かりません!
イメージしづらいと思うので、近くない例えをすると
でしょうか?
読唇・予測・音声認識
じゃあ、どうやって内容を理解しているのかと言うと
上記の3つは私にとって必要不可欠です。
ちなみに、相手の唇が見えている状態だと
でしょうか。
前提条件として「予測」がはたらいていますが。
読唇スキルについて
聴覚障害全員が読唇できるわけじゃありません。
手話も全員ができる訳じゃないですよねー。
なわけあるかい!Σ\(゚Д゚ )
読唇も同じ感じですよー。
読唇って、使わないと下手になっていくんですよ…
さらに、習得するのに結構な時間がかかります。
私は小学生時代、6年間、健聴の学校に通っていたのでそこで習得しました。
今回の「音声認識イベント」で分かったこと
いつもはWordの音声認識を使っています。
基本的には相手の顔を見ているので、一瞬で文字を追えるような画面じゃないと普段使いはしにくいです。
ずっと画面を見てるのは、なんか嫌。
そういう背景もあって、Wordの音声認識を愛用していますー!(ほんとにありがとうございます。)
2人のとき!
ただ、2人で音声認識結果を確認しながら会話するのであればGroup Transcribeでしょうか。
慣れてる自分はWordでもいいんですが、相手が苦痛になって音声認識を見てもらえなくなると、本当に音声認識結果が合っているのか分からなくなります。
たまにあるんですよ。
文脈に合っていて、かつ、文法も合っている
なのに、
発話内容と異なる認識結果になることが!
多人数なら
なので、マイクをできるだけ真ん中において、
Wordで音声認識してます。
これなら、間違いはあるだろうけど、
ある程度の精度で音声認識結果を出力してくれます。
なんといっても、試した他の音声認識ツールより認識速度がある!
精度はどれも完璧じゃない!
認識率100%のツールがあるならそれ使ってますよ。
現時点で、完璧な音声認識は無いと思います。
今回の「音声認識イベント」で色んなもの試せたし、聴者の方に音声認識の弱点とか知ってもらえたし(多分。)
いいイベントでしたー。
またやりたいなー。
次は全員が補聴器を外して、(聴者の方は耳を塞いで)、音声認識と読唇のみで会話したいなー!
以上、やまもんでした。
(ひっさしぶりのnote、書き方下手になった気がする。)