脳内ホンヤクの時代が来る!?
興味深い研究を、Meta(旧Facebook)のAI研究組織が発表しています。
ようは、
脳活動から言語によらずそのまま翻訳出来る可能性が出てきた、
という話です。
上記のMeta社発表サイトのうち、こちらの図が分かりやすいです。
wav2vec2とは、一言でいうと音声認識フレームワークです。
ラベル付き(書き起こし文のイメージ)とラベルなし音声データ両方を学習に活用する、いわゆる「自己教師あり学習」の手法を採用しています。
元々Meta社はこの研究を進めており、wav2vec2についても分かりやすく説明したサイトもあるので紹介しておきます。
研究内容自体は分かりやすいですね。
脳をこじ開けずに磁気の動きを測定できる機器(MEG)から、直接的に読み取ってニューラルネットワークでマッチングするわけです。
今回は、英語とオランダ語で試みたとあるので、今後の他言語でも直観的にはいけそうです。
この領域は、BCI(Brain Computer Interface)やBMI(Brain Machine Interface)と呼ばれます。
もしかしたらMeta社がこういった研究を行っているのが新鮮と思っているかもしれません。
結構長い間脳波でタイピングする、ということは大規模な投資を以前から行っていました。少なくとも、2016年には公式な開発者会議で発表しており、水面下ではもっと以前から行っていたと思います。
これは、いわずもがな、SNSの次に来るメタバースの時代を見据えての先行投資です。
一時期は、毎分100文字はいける、と注目されていたのですが、研究の進捗が芳しくなかったことと、脳波からデータを読み取るという行為がもたらす企業イメージを配慮してか、2021年からは、リストバンドなどIoT系の開発を強調します。
こういった経緯があったので、個人的には逆に改めて方針が変わったのかなと感じました。
というのも、ニュースで2022年6月に、独立していたAI組織が各製品に分散したという内容がながれたからです。
AIの業界で有名な、ヤン・ルカンもこのAI組織で基礎研究分野を束ねていました。そして今でも野心的に知能の仕組みについて新しいフレームワークを提唱しようとしているのは、過去にも触れました。
今回の発表スタンスを見ると、ビジネスの香りを全く感じさせず、Openかつ学術的な貢献をアピールしているように感じました。
今年の組織改編とのつながりがよくわかりませんが、もしかしたらイーロン・マスク氏が過去AIをOpenに研究させたように、NPO化して独立させていくのかもしれません。
似たような研究を行っている機関もあるので、ぜひ世界中で手を取り合ってまずは言語障害を持っている方々を救ってほしいです。