スクリーンレスPCとAIノイズキャンセリングが描く新しい未来

2024年6月3日 07:04

今まで見たSF映画で忘れられない１つに、「マイノリティレポート」があります。

ジャンルで言えば「未来予知」で、その舞台がとてもリアリティのある近未来を描いています。

例えば、今VisionProなどXR機器でジェスチャーでの操作が話題ですが、これも普通に使いこなしています。多分これは実現するでしょう。

関連ですが、最近スクリーンレスPCが話題になっており、これもこの世界に貢献するかもしれません。

もう１つ印象的なシーンを1つ挙げると、主人公が騒々しい道を歩いているときに、パーソナライズされたデジタル呼び込み広告（動画）が流れてきます。さながらキャバレー街（死語？）で「社長さんよってかない？」の風景ですが、きちっとターゲティングしてます。

少なくとも今の技術（個人認識も監視カメラで可能）で出来ますが、気になるのはプライバシー。自分の周囲にもまる聞こえです。

ところが、それも払拭するノイズキャンセリング技術が目下実用に近づいています。こちらで紹介しています。

AI（ニューラルネットワーク）を使って、特定の人の声だけを識別して大きくしてくれます。

このAIは「知識蒸留」という手法を採用しています。

蒸留はお酒なのでよく聞かれますが、混合したものを分離・抽出する技術です。比較的わかりやすかった解説記事を添えておきます。

今回の用途では、リアルタイムに処理をする必要があります。
酒の蒸留は非常に時間と辛抱を要すので、AIにおいては工夫がいります。
そのために、答えを教える教師（大量学習のデータモデル）とそこからすぐ学んでくれる生徒という二人の役割を設定することで軽やかな性能を実現します。それ以上の詳細に興味があるかたは、下記サイトが分かりやすかったです。

次にハードウェアですが、現時点では、イヤフォンとマイクロコンピュータを有線でつなぐ必要があるようです。
まずイヤフォンで特定の声を聞き取ったものをコンピュータで学習し、以降はその声とのマッチングで識別するようです。

面白いそうな技術ですが、どういった使い方で役立ちそうでしょうか？

真っ先に思い浮かんだのが、国会のヤジ。

正直邪魔なので、話し手の声だけを分離してあとは除去してほしいです。

そう考えたら、悪い会議とかも非生産的な意見は消したい時がありますが、角が立ちそうなのでちょっと難しそうですね。

いずれにしても実用性は高いので、今からユースケースを考えておくのはよいかもしれません。

この記事が気に入ったらサポートをしてみませんか？