【私が使う音声認識ツール】聴覚障害のある大学3年生、やまもん。

やまもん(hayato)【聴覚障害＆大学院生】

2022年12月20日 00:45

お久しぶりです！
実は、様々な音声認識ツールを用いて、聴覚障害のある方や、ない方と一緒にお話する機会がありました。
4、5種類くらいの音声認識ツールを試しましたー！

そこで得たことや気付いたことを書きます！

やまもんの聴こえ方

以前、↓の記事を執筆しました。

聴者の平均的な聴力を0dB(デシベル)とすると、
私の聴力は10年ほど前の測定結果だと、

裸耳(左) : 103dB
裸耳(右) : 101dB

です。
数年前に測定した結果だと、スケールオーバー(測定不能)していました。
年々聴力は悪くなってますね〜。

100dBの聴こえは、ガード下にいても電車の音が聴こえるか聴こえないか、だそう。
以前、飛行機の中で補聴器外したらエンジン音も何も聴こえなかったなぁ。

補聴器を装用すると音は聴こえるが…

話し声は聴こえます。
が
内容は分かりません！

イメージしづらいと思うので、近くない例えをすると

耳を塞いだ状態で
数個の単語しか知らない他言語を
聴いている感じ

でしょうか？

読唇・予測・音声認識

じゃあ、どうやって内容を理解しているのかと言うと

読唇 :
唇の形で何を言っているのか把握！
個人的には後ろ斜めから見た唇が1番読みやすい。

予測 :
話している空間にあるものをとりあえず覚える！
何について話しているのか複数の予測を立てながら、
唇や動きから拾えた情報を元に把握！
（おかげで写真のように記憶する力が付きました）

音声認識 :
マスクが標準装備となった現在において、読唇を封じられた私が頼りにしているもの。
ただ、これがベスト！っていう音声認識ツールはまだ無いです。
(これについてこれから話していくよ)

上記の3つは私にとって必要不可欠です。
ちなみに、相手の唇が見えている状態だと

読唇 : 70%
音声認識 : 30%

でしょうか。
前提条件として｢予測｣がはたらいていますが。

読唇スキルについて

聴覚障害全員が読唇できるわけじゃありません。
手話も全員ができる訳じゃないですよねー。

ある日突然、あなたの耳が聴こえなくなりました。
あなたは聴覚障害者です。
もちろん、｢手話｣は使えますよね？

なわけあるかい！Σ＼(ﾟДﾟ )
読唇も同じ感じですよー。

読唇って、使わないと下手になっていくんですよ…
さらに、習得するのに結構な時間がかかります。

私は小学生時代、6年間、健聴の学校に通っていたのでそこで習得しました。

今回の｢音声認識イベント｣で分かったこと

人数によって使い分けたほうがよさそう。

いつもはWordの音声認識を使っています。

私がWordの音声認識を使う理由 :
発話者は見たらある程度、把握できる。
→発話者ごとの改行は要らない。
→句読点も要らない。

一瞬だけ音声認識出力画面を見た時に、たくさんの文字があった方がいい！

基本的には相手の顔を見ているので、一瞬で文字を追えるような画面じゃないと普段使いはしにくいです。
ずっと画面を見てるのは、なんか嫌。
そういう背景もあって、Wordの音声認識を愛用していますー！(ほんとにありがとうございます。)

2人のとき！

ただ、2人で音声認識結果を確認しながら会話するのであればGroup Transcribeでしょうか。

Group Transcribeが2人での会話に合ってると思った理由:
改行がある！
改行がないWordだと、音声認識に慣れていない聴者の方に認識結果が合っているのか確認してもらうのは負担！

慣れてる自分はWordでもいいんですが、相手が苦痛になって音声認識を見てもらえなくなると、本当に音声認識結果が合っているのか分からなくなります。

たまにあるんですよ。
文脈に合っていて、かつ、文法も合っている
なのに、
発話内容と異なる認識結果になることが！

私は正しく認識されてる！と判断するけど、
実際は間違ってるとか、
そんな悲しいことはないよ……
(恋愛で例えるなら、思わせぶr((ry)

多人数なら

多方向から音を拾うマイク×Wordかなぁ。
多人数の時って、みんなに合ってるか確認してもらうのは現実的に考えて難しいんですよね。

なので、マイクをできるだけ真ん中において、
Wordで音声認識してます。

これなら、間違いはあるだろうけど、
ある程度の精度で音声認識結果を出力してくれます。
なんといっても、試した他の音声認識ツールより認識速度がある！

精度はどれも完璧じゃない！

認識率100%のツールがあるならそれ使ってますよ。
現時点で、完璧な音声認識は無いと思います。

状況に合わせて使い分けるしかない！

今回の｢音声認識イベント｣で色んなもの試せたし、聴者の方に音声認識の弱点とか知ってもらえたし(多分。)
いいイベントでしたー。

またやりたいなー。

次は全員が補聴器を外して、(聴者の方は耳を塞いで)、音声認識と読唇のみで会話したいなー！

以上、やまもんでした。
(ひっさしぶりのnote、書き方下手になった気がする。)

いいなと思ったら応援しよう！

👂🏻👈🏻🙅🏻聴覚障害のある大学1年生、やまもんです【情報格差をなくしたい】という目的でnoteを始めました。有益な情報を提供できるよう毎日投稿します。応援していただけると嬉しいです。 noteで得た収入は情報発信のために使わせていただきます。よろしくお願いします。