ブレインコンピュータインタフェース技術者が語る技術の展望

2019年9月28日 09:16

以下の記事が面白かったので、ざっくり訳してみました。

・Imagining a new interface: Hands-free communication without saying a word

0. 要約

2017年のF8で、私たちは「Brain-Computer Interface」(BCI)プログラムを発表し、自分が話していると想像するだけで入力できる非侵襲性のウェアラブルデバイスを構築するという目標の概要を説明しました。そして研究の一環として、カリフォルニア大学サンフランシスコ校（UCSF）の研究者チームをサポートし、脳の活動から意図した発話をリアルタイムで検出することで、神経障害のある患者が再び話すための研究を行いました。

今日、UCSFチームは、Nature Communicationsの記事でその調査結果の一部を共有しました。

1. はじめに

エミリー・ミュグラーにとって、それはすべてを変えた瞬間でした。
2017年4月下旬、レジーナ・デュガンはF8で、挑発的な質問を投げかけました。

「脳から直接入力できるとしたらどうでしょうか。」

彼女はFacebookで行われているエキサイティングな研究に進みました。言葉やキー入力することなく、自分の言いたいことを想像するだけで入力できるようにすることを目標にしています。

「私はその夜に履歴書を送りました。」
ミュグラーは回想します。

数年前、ミュグラーはALSまたはルー・ゲーリッグ病の結果として話すことができなかった患者と仕事をしていたました。当時、彼女は脳の電気的活動を測定するために「脳波検査」（EEG）を使用していました。「患者が一文を入力するのに70分かかることもあった」と彼女は言います。彼女は人々の生活を改善するためのより良い、より効率的な方法を探していたので、この仕事は彼女の博士課程の研究全体を通して彼女をやる気にさせました。

彼女はより効果的なコミュニケーション手段として、2004年に「脳波記録」（ECoG）を使用したBCIの研究を開始しました。しかし、世界中にはほんの一握りの研究室しかありませんでした。さらに、「ECoG」は皮質上に電極を配置する必要があるため、体外で機能する完全に非侵襲的な解決策が不足していました。

F8の基調講演を見て、ミュグラーはFacebookでBCIを調査するための作業に興奮していました。

2. 未来に向けた設計

今日のスマートフォンのすべての知識、楽しさ、実用性がすぐにアクセスでき、完全にハンズフリーになる世界を想像してみてください。世界のどこにいても、あなたの人生で最も重要な人々と充実した時間を過ごすことができます。また、外部の注意散漫、地理的制約、さらには身体障害や制限に関係なく、有意義な方法で他の人とつながることができます。

それは私たちが信じる未来であり、スタイリッシュな拡張現実(AR)メガネの究極のフォームファクターで完全に実現されると考えています。チーフサイエンティストのマイケルアブラッシュと「Facebook Reality Labs」(FRL)のチームとして、私たちは人間指向コンピューティングの次の大きな波の端に立っています。ARとVRを組み合わせたテクノロジーが収束し、私たちの周りの世界とのやり取り方法に革命をもたらします。

その未来はまだまだ先ですが、今日行われている初期段階の研究はその約束を果たすための第一歩であり、解決する必要がある最も重要な問題の1つは「入力問題」です。つまり、ARメガネを着用したら、実際にどのように使用するのでしょうか。

そこで「BCI」の出番です。

3. 新しいインターフェース

「ウィリアムギブソンとニールスティーブンソンの小説でBCIを読んで育ちました。大人のほとんどは、BCIが本物になるかどうかを理解しようとしていました。」
FRLのリサーチディレクターであるマーク・チェビレットは語ります。

「マシンを心で制御することは、もはやサイエンスフィクションではありません。今日、それを行う方法は他にありませんが、私たちのチームの長期的な目標は、これらのことを非侵襲性のウェアラブルデバイスで行うことです。」

FCIに参加してBCI研究に専念するチームを構築し、リードする前に、チェビレットは「ジョンズホプキンス大学応用物理学研究所」(APL)にいました。チェビレットは、APLの応用神経科学の関連研究プロジェクトのより広範なプログラムを構築し、技術が将来どこに行くことができるか、そしてそれが潜在的に非侵襲的な方法が、多くの人々を助ける可能性があるかを示しました。

Facebookに採用されてBCIに焦点を当てたチームを構築した後、チェビレットは可能性の限界を押し広げ、最新技術を再定義する野心的な長期研究プロジェクトを提案し、追求するよう奨励されました。

ウェアラブルデバイスを使用した通信のためのBCIは、話すことができない人々が対話できるようになるだけでなく、人々がデジタルデバイスと対話するための強力な手段になる可能性があります。

スマートホームデバイスやスマートフォンの入力メカニズムとして音声が注目を集めていますが、必ずしも実用的とは限りません。混雑した部屋、騒がしい街の通りを歩いている、または静かなアートギャラリーにいる場合はどうでしょうか。ほとんどの人は電話で音声アシスタントを使用していますが、他の人の前で音声アシスタントを使用することはほとんどありません。

しかし、タイピングの離散性と、ハンズフリーで音声の速度が得られるとしたらどうでしょうか？

3. 2つのチーム、共通の目標

そのビジョンを念頭に置いて、チェビレットは、非侵襲的でウェアラブルなBCIデバイスの夢が現実になるかどうかを理解できる学際的なチームの構築に着手しました。

「スピーチの生成とその背後にある神経科学を本当に理解している人が必要でした。幸運にもエミリーを見つけました。または彼女が私たちを見つけました」
と彼は言います。

チームには、生物医学イメージングから機械学習、量子コンピューティングまで幅広いバックグラウンドを持つ研究者が集まりました。しかし、FRLチームが解決する準備ができていない問題が1つありました。構築するウェアラブルデバイスの種類を正確に把握する前に、サイレントスピーチインターフェイスが可能かどうか、可能であれば、それを機能させるために実際に必要な神経信号を知ることです。

現在のところ、その質問には、埋め込み電極を使用しないと答えられません。そこで、チェビレットは彼の長年の同僚であるエドワード・チャンに連絡しました。彼は、神経障害のある患者の新しい治療法の開発に専念しており、音声神経科学研究チームも運営しています。

「私は彼のオフィスでエディに会いに行ったが、ビジョンを並べただけだ」
とチェビレットは回想します。

「スピーチBCIがウェアラブルデバイスを使用して可能になるかどうか、
そして彼のチームの研究がどのように埋め込みをサポートしているかを知りたいと説明しました。」

チャンは、脳幹卒中、脊髄損傷などの重度の脳損傷の後、後で話すことができない患者のための通信装置の開発を長い間計画していたことがわかりました。しかし、彼はそのような野心的な目標には、多くのリソースが必要であることを知っていました。

麻痺や他の形態の音声障害に苦しむ人々の生活を改善することを目的としたUCSFの研究の重要性と、BCIの長期的な可能性に対するFacebookの関心を議論した後、脳の活動から音声をリアルタイムでデコードすることが本当に可能かどうかを示すという共通の目標とチームを組むことにしました。

4. 有望な（まだ予備的な）結果

今日、Nature Communicationsで、チャンとチャンの研究室の研究者であるデビッド・モーゼスは、人々が話している間に記録された脳活動を使用して、彼らが言っていることをほとんど即座にコンピューター画面上のテキストにデコードできることを実証する研究の結果を発表しました。

以前の投稿作業はオフラインで行われましたが、本書の重要な投稿は、UCSFチームがリアルタイムで脳活動から完全な話された単語やフレーズの小さなセットをデコードできたことです。これはBCI研究の分野で初めてです。研究者たちは、これまでのところ少数の単語とフレーズを認識できるだけとしていますが、現在進行中の作業は、はるかに大きな語彙を劇的に低いエラー率で翻訳することを目指しています。

過去10年間、神経科学は非常に大きな進歩を遂げました。脳が音声をどのように理解して生成するかについて、私たちは多くを知っています。同時に、新しいAIの研究により、音声をテキストに変換する能力が向上しました。自分の言いたいことを想像して人々を助けましょう。これは、麻痺のある人々の生活を劇的に改善する可能性です。

Nature Communicationsの論文で行われた作業には、てんかんの治療のために脳外科手術をすでに受けていた通常の発話を持つボランティア研究参加者が含まれていました。Project Stenoの最終段階では、脳活動を使用して障害に直面した場合の単一の研究参加者のコミュニケーション能力を回復できるかどうかを確認するための1年間の調査を実施します。UCSFは研究プログラムを監督し、研究ボランティアと直接連携しています。Facebookの研究者は、特定されていないデータへのアクセスを制限されており、UCSFのオンサイトに常にあり、その管理下にあります。

最終的に研究者は、1,000語の語彙と17％未満の語エラー率で、毎分100語のリアルタイムデコード速度に到達することを望んでいます。UCSFの研究が、完全に非侵襲性のウェアラブルデバイスに必要なデコードアルゴリズムと技術仕様の開発に役立つことを願っています。

UCSFで見たのと同じ結果を非侵襲的な方法で得ることができるようになるまでには長い道のりがあります。そのため、FRLはMallinckrodtを含む他のパートナーと非侵襲的なBCIメソッドを探求し続けています。

5. 最近の研究動向

最近では「近赤外光」を使用したシステムを試しています。
ニューロンは体の他の細胞と同様に、活動しているときに酸素を消費します。そのため、脳内の酸素レベルの変化を検出できれば、脳の活動を間接的に測定できます。パルスオキシメータ(医師の診療所で人差し指に付けたと思われる赤く光るクリップのようなセンサー)を考えてみてください。指で血液の酸素飽和度を測定できるように、近赤外光を使用して、体外から脳内の血液の酸素化を安全かつ非侵襲的に測定することもできます。これは、「fMRI」で測定された信号に似ていますが、消費者向けの部品で作られた携帯型のウェアラブルデバイスを使用しています。

現在はかさばり、低速で、信頼性が低いので、このシステムがARの入力の問題をすぐに解決することは期待していませんが、その可能性は非常に大きいため、この最先端技術を改善し続けることは価値があると考えています。

酸素飽和度を測定することで想像した文章を解読することはできないかもしれませんが、「ホーム」「選択」「削除」などの少数の想像したコマンドでさえ認識できれば、今日のインタラクションのまったく新しい方法を提供できます。

また、脳の活動を検出する主な手段としての血中酸素化の測定から、血管やニューロン自体の動きの測定へと移行する方法を模索しています。スマートフォンおよびLiDARの光学技術の商業化のおかげで、小さくて便利なBCIデバイスを作成して、現在埋め込み電極で記録しているものに近い神経信号を測定できます。

10年かかるかもしれませんが、私たちはギャップを埋めることができると思っています。

6. 責任ある革新

テクノロジーは不可避でも中立的でもありません。常に社会的および歴史的背景の中にあります。近年、米国、ヨーロッパ、日本、中国、およびオーストラリア全体でのかなりの国際投資に一部牽引されて、ニューロテクノロジーは劇的な進歩がありました。その結果、何が可能か、何を意味をするのかを人々が理解するには時間が必要です。

BCIがARの入力メカニズムとして組み込まれるのはまだ先ですが、組み込まれる前に重要な質問の答えを考え始めるのは早すぎることはありません。

どのようにデバイスを安全に保護できますか？
肌の色に関係なく、すべての人のために機能しますか？
そして、人々が望むようにプライバシーとデータを管理するのにどのように役立ちますか？

「私たちはすでに多くのことを学びました。たとえば、プログラムの初期に、協力者に、てんかん患者からの特定されていない電極記録を共有してもらい、ソフトウェアの動作を検証できるようにしました。研究コミュニティでは非常に一般的であり、一部のジャーナルでは保護の追加レイヤーとして必要になったため、電極データはまったく配信されなくなりました。」

「私たちは他の誰よりもテクノロジーをよく知っているので、コミュニティの人々と話し合うべきです」
とマグラーは付け加えます。

「私たちは全員訓練された生命倫理学者ではないからといって、会話に参加できない、または参加すべきではないという意味ではありません。実際、すべての人が科学の進歩を適切に認識できるようにすることは私たちの責任です。そのため、この技術の将来について十分な情報に基づいた議論を行うことができます。」

「このテクノロジーに関連するすべての倫理的問題を自分で予測したり解決したりすることはできません」
とチェビレットは語ります。

「このテクノロジーに関する懸念を人々に伝えることができるように、私たちが取り組んでいることに透明性を持たせるつもりです。」

7. 未来へのビジョン

ARのプロミスは、人々を周囲の世界とシームレスに結びつける能力にあります。電話画面を見下ろしたり、ラップトップを開くのではなく、アイコンタクトを維持し、便利な情報とコンテキストを取得できます。魅力的なビジョンですが、進取の気性、膨大な決意、オープンな心を必要とするものです。

終日装着可能なARメガネの入力の問題はまだ解決されておらず、BCIは解決策への説得力のある道筋を表しています。10年後、脳から直接入力する能力は当然のように受け入れられるかもしれません。昔はSFのように聞こえましたが、今では実現可能な未来だと感じています。