Windows音声認識の活用シーン

2024年10月31日 01:54

　Ｗindows音声認識の弱点としてよく語られる点は、文章への変換精度が悪い、ということにあると思います。筆者も使ってみましたが正直、文章生成に関してはかなり厳しい部分があるように思えます。GoogleのVoiceInなどの大規模言語モデルから生成される文章の精度を見てしまえば、Ｗindows音声認識を使う理由が見つからないのも無理はないと思います。

　結論から言うと、Windows音声認識の使いどころは、ネットの繋がらない環境あるいは繋げられない環境で、数字あるいは決まった単語を入力する場面においては非常に適していると思います。しかもこれが非常に安い費用で実現してしまうのです。（せいぜいマイク代やヘッドセット代が必要になる程度）

活用シーンその1

　例えば、工場においては製品の検査工程が存在すると思いますが、不良品が出た場合、不良項目をカウントすることがあると思います。どの製品でどんな不良項目がどのくらい発生するのかを分析し、改善策を検討するにあたって大変重要なデータになります。たいていの場合は、手押しカウンターや定置型の数取り器などを用いて不良項目ごとの数量をカウントし、紙やPCに転記するという使い方が一般的かと思います。
　だれでも使い方が簡単で教育コストのかからないことが利点ですが、不良品が見つかるたびに押しボタンに視線を移し、ボタンを選んで押し、再び検査に戻るという視線の動きが無駄になりますし、ボタンを探すこともストレスを蓄積する原因になります。
これを音声で不良項目を入力することで製品から視線をそらすことなくPCに直接データをカウントさせることが可能となります。不良項目は無限にあるわけではなく、決まった単語でしかないため、辞書登録さえしてしまえば充分可能な方法となります。

活用シーンその2

　実験や検査において、実験データの数値をエクセルに大量に入力する場面を想定したいと思います。測定器具からPCにUSBケーブルや無線でつないでPCに直接データをインプットする機能があればそれを使うに越したことはないのですが、そうした機能のない測定器具も多数あります。
　例えば寸法を測定するノギスで、USBケーブルでデータを送る機能がついていない場合を想定してみます。測定したらいったんノギスから手を離して、テンキーで数値を入力し、またノギスを持ち直すというわずらわしい手間が発生することになります。視線もいったんテンキーに移すため、試験体に視線を戻した際に「次の測定箇所はどこだったっけ？」と探すこともあると思います。
これを音声で数値を入力することで、USBケーブルでデータ転送するのと遜色ないスピードで、視線を試験体からそらすことなく、次々にデータをインプットすることが可能となります。しかもUSBケーブルは1万円近くかかってしまうのですが、Windows音声認識の場合、Windowsの標準機能で搭載されているので無料でそれができてしまうのです。（マイクやヘッドセットの購入は必要ですが、安物で十分です。）
　また、二人の人員をかけて一人が測定して数値を読み上げ、もう一人が数値を入力するような場面では、この方法で一人で同じことができるようになります。

活用シーンその3

　製品の在庫を置く場所が、品番ごとに決まった置き場所がない場合を想定してみます。在庫管理の点からは宜しくない状態ではありますが、そうはいってられない場合もあると思います。この状態でいろいろな場所にいろいろな品番を置いてしまうと、後で探すことに無駄な時間を使うことになります。　場所ごとに簡単な名前を付けておき（例：松の間、竹の間・・・）、品物を置く際に、品番と場所の名前を音声で入力すれば、PCにキーボード操作でインプットする操作を行わず入力することが可能となります。フォークリフトを運転しながらの場合であれば、フォークリフトにモバイルPCを設置し、音声で入力すれば、運転しながら製品の置き場所をインプットすることが可能になります。そこそこ大声で話す必要がある騒音のある環境でも、マイクの種類やマイクの調整で問題なく入力可能です。品番と場所をデータベース化することで、後で場所を検索することが容易になります。

　このように非常に安価な方法でありながら、かなり仕事がはかどる仕組みを作ることができるのですが、Windows音声認識はあまり日の目をみていない状況になっているように思います。

　今後の記事においては、どのように設定していくかとか、使い方のコツなどを紹介していきたいと思います。

Windows音声認識の活用シーン

活用シーンその1

活用シーンその2

活用シーンその3

いいなと思ったら応援しよう！