
20241207-01 温故知新~音声認識のあのころと今と~
※タイトル画像は「YYProbe」開発している人のポストを使わせてもらいました。
昨日書いたnoteの続き。
音声認識といえば、こんな使い方をする会社もあったようだ。要はシステムとしての使い方。確かにセキュリティの面ではこうした使い方が理にかなっている。
ただね。仕事のコミュニケーションっていろんなところに転がっているんだよ。雑談だって大切なコミュニケーション。そんなときにわざわざこんなシステムを持ち出すのと気軽にアプリを使うのとでは雲泥の差でもある。
昔だったら「聞こえないので書いてください」とノートを差し出したりブギーボードを差し出したりして「筆談」をお願いしなきゃいけなかったことが、アプリを差し出すだけで相手の話が文字になって表示される。
これってイノベーションと言わずになんて言えばいいの?と言いたいくらいのイノベーションだよ。いつか「筆談」なんて死語になるんじゃないの?って思えるほどに。
とはいえ、今も改良の余地は当然に残る。それは音声認識に限らずどんなSystemだってアプリだって残る余地なんだけど、そこに手をちゃんと付けてくれる姿勢がうれしい。その姿勢のひとつの成果が以下のポスト。
開発中の「MYエンジン」を使って機能の違いを比較してみました。
— 「YYProbe」開発してる人📛 (@yysystem_dev) December 6, 2024
同じ文章を読んでもらい以下の4つを比較しました。
①LINE音声入力
②YY文字起こし標準エンジン
③MYエンジン
④MYエンジン+AI自動修正
素晴らしい結果です!! https://t.co/X0mQMhi7oG pic.twitter.com/ujBv0MqUS6
そうそうそんなレベルだったんだよ。どんなに滑舌が良いひとでも「仕込み」をしなかったら無茶苦茶な変換になったもの。たとえば上記のポストでいう①のようなもの。いや、もっとひどかった。
どれくらいひどかったかというと、会議でIT業界の真面目な話題を議論しているのに、「ハローキティがどうしたこうした」とか「今晩のおかずがなんたらかんたら」ってそんな表示が日常茶飯事。
初期の音声認識ってこんなレベルだったから、これで諦める人たちが出るのは普通のことだったんだ。私だってどれだけソフト購入に投資して、どれだけ絶望したか。そんな歴史だけで1つの論文だって、なんなら1冊の本だって書けそうなものだよ。
そんな絶望から救ってくれているのが今の音声認識アプリなんだ。書き残したいのは、このアプリのおかげでどれほど救われているかってことだし、どれほど感謝しているかってことなんだ。
ただね。一つだけ忘れずに伝えたいことがあって、絶望の時代とはいっても絶望だけじゃなかったってこと。例に引いた会社もそうだったと思うけど、自分の声を吹き込んで自分専用の音声認識ソフト(当時はアプリなんて言わずにソフトと言ったんだ)に育て上げてくれた。時間とロードをかけて使えるものにしてくれた。そんな人たちがいたんだ。
そんな人たち存在とそのあたたかさを知ることができるってことは、まんざら捨てたものではないんだ。大げさではなくて生きる希望になったものだよ。今もその人たちへの感謝とともに、その試行錯誤の過程は鮮明に覚えているのは当然だ。
忘れてええことと、忘れたらあかんことと、ほいから忘れなきゃあかんこと
この言葉を教えてくれたのは鷲田清一先生(元大阪大学総長の哲学者)のどこかの本だった。それに倣えば、こうした歴史を知ることと今の感謝は「忘れたらあかんこと of 忘れたらあかんこと」だからこうして書いている。
私がそんな人たちに救われて今があるのと同じように、今はYYSystemさんが繰り出してくれるイノベーションが、どこかの誰か生きる希望になっているだろうって容易に推察できるんだ。
どこかの誰かってカッコ良い言葉をつかえば「サイレントマジョリティ」。まさにこんな時に使える概念だなって思いながら、今日もありがとうと3回伝えたくて書いた。