補聴器のAIって何だ!?調整ソフト、使いこなしていますか?#043
最近はどこの補聴器メーカーも、AI、AI、AI、AI。AIが流行ってますね。
皆さんの考えるAIってなんでしょうか?
補聴器におけるAIってなんなんでしょう?
実は学生時代の大塚は情報系の勉強をしておりました。いわゆるプログラミングやコンピュータを専門にしていたので、最近の「AI、AI、AI!」そんな論調について、ちょっと違和感を感じている次第。
今回はAIと調整ソフトについて考えていきたいと思います。
AI研究はチューリングという天才数学者が最初(らしい)
AIはArtificial Intelligence(アーティフィシャル・インテリジェンス)の略称。Artificialは「人工的な」、Intelligenceは「知能/知性」という意味を持っています。日本語に訳すと人工知能になります。
AIの概念は、イギリスの数学者アラン・チューリングが1950年に出版した著書『計算する機械と人間』に起源があるようで、彼は「機械は考えることができるか?」という問いを唱えました。
ちなみにチューリング博士は、電子計算機の発明者でもあり、伝説では発明した時に「私の次に計算が早い奴が出来た」と言い、原子力研究にも貢献した天才科学者です。
そんなチューリング博士の問いのあと、1956年にダートマス大学で人工知能について議論する会議が開催され、人間のように考える機械のことを「人工知能」と呼ぶことにしよう、と正式に呼び方が決まりました。
チューリング博士は、人工知能ソフトウェアを発明したわけではないのですが、人工知能として認めるか否かの合格基準を提案しています。それがチューリングテストです。
チューリングテスト(Turing test)は、機械の能力が、人間が行う「知的活動」と同等、もしくはそれと区別がつかないほどであるかを確かめるためのテストです。
具体的には、機械が人間の模倣をして、それに人間が気付かないかどうかをテストします。人間に気付かれなければ、それは人工知能と認めてOK、気付かれるようならNGというわけです。
AIの定義が、ダートマス会議やチューリングが考えたような「人と区別がつかない知的活動」とするなら、補聴器にAIを入れるって、どうも意味が分かりません。
最近のAI補聴器がやっていることは機械学習による学習済みプログラムが入っているだけ。
少し前にGoogle、Microsoft、AppleなどのIT大企業の間で流行った機械学習という技術があります。
機械学習というのは「何かしらの知能のようなプログラム」を作るための手法です。
人間が複雑なプログラムを作るのは難しいので、勝手に学習するシンプルなプログラムを作り、そこに教材となるデータを与えます。そうすると後はプログラムが自動で規則性を発見し、学び、賢くなっていく。この手法のことを機械学習と言います。
おそらく補聴器メーカーがやっていることは、大雑把には下記のような流れだと思います。
学習するプログラムを作る。
データをたくさん用意して、学習させる。
学習済みプログラムを手に入れる。(例、多様な環境を識別して、指向性を自動調整する精度が高い等)
学習済みのプログラムを補聴器に入れる。
出荷する。
以後、補聴器は基本的に大きな学習をしない。
ちなみにIT大企業がやっている機械学習は、インターネット上にあるサーバーでプログラムが動いているので、学習し続けることが可能です。
補聴器はインターネットに常時接続しているわけでもなく、装置は小さく、電力もたくさん使えません。リアルタイムで学習し続けるのは、まだムリだろうと僕は思います。
最近のAI補聴器の良いところは?
補聴器メーカーもAIをPRする以上、言葉の定義は置いておいて、良いところがあるはずです。
お客様がいる現場に目を向けて、具体的なメリットを考えてみましょう。
先にご紹介した通り、補聴器は機械学習によって、様々な音環境とその中で有効な調整状態の組み合わせを学習している(とされている)。
音環境と利得や調整の組み合わせ、どこかで聞いたことがないでしょうか?そう、10年以上前からある「環境適応型補聴器」のことです。補聴器業界は10年以上前から(広義の)AIを導入していたのです!
近年、AI開発手法の一つである機械学習が流行したので、流行りに乗った補聴器メーカーが、AIという言葉を使っているだけで、ある意味では元々AIが入っていたのです。
AI補聴器は、特別に新しいわけではなく、機械学習を使うことで環境適応の精度が進歩しているようです。
先日、企画会議で中川さんから「AIで何か一本記事書いてよ。最近の補聴器がメーカーごとに何が違うとかさ」とお題をいただいたのですが、補聴器の環境適応機能の検証はとても難しいことの一つです。
調整ソフトを使いこなすために知るべきこと
AI補聴器は、環境の変化に合わせて補聴器から出てくる音を変えるということなのですが、遠慮なく言ってしまえば”元々あった一つ一つの機能”を総合的にイイ感じにしてくれているだけなのです。
まずは補聴器に備わっているいくつかの機能を振り返ってみます。機能をAIと関連して理解するために、様々な機能について”判定”と”実行”という点で考えてみましょう。そして”時間スケール”について、少しご紹介しておきます。
①ノンリニア補聴器のコンプレッション機能。
これは補聴器の利得を入力音圧によって変える機能です。細かく見ていくと、アタックタイムとリリースタイムがあります。
ノンリニアな補聴器は、ニーポイントを超える大きな音が入力されても瞬時に利得を変化させるわけではないのです。
そこには器種もしくは調整の設定ごとに、数十ミリ秒〜長くて1000ミリ秒までのタイムラグがあります。これがアタックタイムです。アタックタイムを超えるまでの間は、大きい入力音圧に対して、小さい音用の大きな利得が与えられているのです。
リリースタイムは、マイクに入ってくる音が小さくなってニーポイントを下回った時、どれくらいの時間が経過してから利得を大きくするかを意味しています。周りの音が急に小さくなっても、補聴器の利得はすぐに上がるわけではなく、しばらく利得は小さいままなのです。
ノンリニア補聴器のコンプレッション機能一つとっても、広い意味では「環境に適応している」と言えそうです。
②環境適応型指向性マイクロホンの判定と実行。
両耳間通信を行わない、原始的な環境適応型指向性マイクロホンであっても、周波数をいくつかに分割して、雑音が多い周波数帯域には指向性を強く効かせて、雑音が少ない周波数帯では無指向性にする仕組になっています。雑音のある周波数帯をもとに”判断”して、指向性の有無を変えているわけです。
これも一種の「環境適応」の機能です。
③ハウリング抑制機能の判定と実行。
ハウリング抑制機能には、いくつか種類があり、それぞれに判定と実行があります。広い意味では環境適応と言えます。
もっとも古典的なハウリング抑制機能は、ハウリングの発生を検知して、ハウリングが発生している周波数の利得を下げる機能です。古い補聴器では大雑把な判定を行っていたので、利得を下げる周波数が広く、明瞭度に大きなマイナスでした。
一応、現在でもこの機能は使われています。この機能はハウリング抑制機能の中では電力の消費が少なく、ハウリングの検知から利得抑制までのスピードが速いのが特徴です。
次に出てきたハウリング抑制機能は、逆位相と呼ばれるものです。利得を維持したままピーピー音を止められますが、電力消費が大きく、動作開始までの時間も長くなる傾向があります。近年、ハウリングの検知と判定のスピードを上げるために、補聴器からの出力音に印を混ぜておく改善が行われています。
おそらく最新のハウリング抑制機能はFL機能を応用したもの。補聴器から出た音が、補聴器のマイクに再び入ってしまった場合、その音については周波数をわずかに低くして出力する方法です。こうすると同じ周波数で増幅が繰り返されることを避けられますから、ハウリングが抑えられます。
これらのハウリング抑制機能は、実際に補聴器を使っているどんな時、どんな場面で動作するでしょうか。
重度難聴の人に大きな利得の補聴器を装用してもらうときには、最善最高のイヤモールドを用意したとしても、顔や首を動かしたり顎関節を動かしたとき、瞬間的に音が外へ漏れてしまうことはあり得ます。
装用者が受話器を耳にあてているとか、首や口を動かしたなど、補聴器が使われている環境がハウリングに影響する以上、ハウリング抑制も一種の環境適応と言えるかもしれません。
④環境適応型の補聴器に固有の機能と調整
環境適応型補聴器は、利得やコンプレッション、騒音抑制や指向性を、すべて環境に合わせて変えられる補聴器のことを指します。環境に応じて利得が変わるなら、どうやって調整したらいいのでしょう?
ここから先は
¥ 990
Amazonギフトカード5,000円分が当たる
この記事が気に入ったらチップで応援してみませんか?