![見出し画像](https://assets.st-note.com/production/uploads/images/110829934/rectangle_large_type_2_303f56c0ed6cc49b49061aa86165b881.png?width=1200)
『GPT-4搭載スマートグラスで目の不自由な人たちは“見える”ようになった。晴眼者用にも是非』~【新しいweb3ビジネスのアイディアのタネ】2023.7.15
Threads始めました。お気軽にフォローくださいませ。
https://www.threads.net/@morypto_tatsuya
■GPT-4が搭載されたスマートグラスによって、目の不自由な人たちは周囲の環境が“見える”ようになった
視覚障害者の支援技術を手がける企業が、OpenAIの「GPT-4」を導入し始めている。AIはユーザーに周辺環境の情報を伝えるほか、質問にも応えられるようになった。しかし、AIが誤った情報や偏見が含まれる情報を生成してしまう点への懸念は依然として残っている。
視覚障碍者向けのスマートグラスを開発していたEnvision社が、GPT-4を搭載した「Ask Envision」の無料トライアルを開始しました。デバイスはGoogle Glassです。
GPT登場で大幅に進化
Envision社は昨年3月にも同じコンセプトのスマートグラスを発表していました。この動画を見ると、スマートグラスが周囲の情報を認識して音声で伝える様子がよくわかります。
AIを搭載し、60言語で書かれた手書き文字を含むさまざまな文字や文章をスキャンして読み上げたり、ビデオ通話をしたり、周囲の環境を装着者に言葉で説明したり、顔認証で友人や知人を判断することができます。
周囲の環境を認識する、文字や文章をOCRで読み上げる、顔認証技術で相手を判別するなどの機能は昨年バージョンでも備わっていました。しかしこの2022年3月時点ではGPTが知られていませんでした。
今年の初めにChatGPTが一般に公開され大ブームになったのはご存じの通りです。そこからわずか半年の間にGPT-4を組み込むという爆速で開発を進め、機能が大幅に向上したそう。
Ask Envisionは以前のバージョンでは、画像内の文字情報を最初から最後まで読み上げていた。一方で現在は、写真内のテキストを要約し、ユーザーからの質問にそのあと答えられるようになっている。
GPTの得意技のひとつが「文章の要約」です。OCRで文字を認識する機能は備わっていたものの、最初から最後まで読み上げて冗長だった不便さを、GPT-4を採用することで要点だけに絞って短時間で情報を知ることができるようになりました。
晴眼者が自然とやっている「ザっと読む」という読み飛ばし能力を身に着けたようなものです。
目の不自由な人々が世界を“見る”ことを補助するためにAIを使うとしたら、年齢や人種、性別を誤認するAIの傾向に晒されてしまうだろう。LLMは有望ではあるが、欠陥があるからだ。
GPTなどAIは誤った情報を返したり学習データの偏りによる不適切な判断をすることもまだまだ多くあります。視覚障碍者に見えないものの情報を伝える場合、見比べて正しいかを判断する術が本人にはないというのは大きな課題です。
しかしGPT-4によって大きく実用性が増したのは間違いありません。
自動運転技術に似ている
自動車も「目が見えない」状況に近いと考えられます。画像・映像で周囲の状況、標識・表示、文字情報を認識し、「目が見えない」クルマに対して情報を伝える。
クルマに対しては言語ではなくデータで返しますし、認知の後のプロセスである「判断」と「操作」までをクルマ側が行うという点でも違いがあります。
しかし視覚障碍者向けスマートグラスがより進化していくと、認知したものから必要情報を選り分け優先順位をつける「判断」や、必要に応じてアラート音やバイブレーションで危険を伝えたり、電動車イスと連動してブレーキをかけるなどの「操作」も行うようになるかもしれません。
目が見える人も便利に
目が見えていても「見ていない」「気づいていない」ということはよくあることです。事故の危険を察知して回避するのはもちろん、お得な情報を見逃さない、興味のある情報を優先して伝えるなどの便利な使い方ができるように進化すれば、視覚障碍者だけでなく誰にとっても便利なデバイスになるはずです。
外国語を音声認識して自動翻訳し、ARグラスにテキストで表示するコンセプトも昨年Googleから発表されています。
ハードウェアとしてのGoogleグラスは開発が中止されたという残念な報道もありましたが、ARソフトウェアの開発は続いているようです。
また継続しているとしているARソフトウェアについても責任者が退職していることが明らかになり不安ではありますが、Googleに限らず様々な企業がGPTなどAIを活用した開発に活路を見出して、目が見える人も便利に使える未来ガジェットができるんじゃないか、量産効果で安価に数多く普及するんじゃないかと期待しています。
AR普及はデバイス次第か
BMWがバイクで走行中にナビゲーションの案内やスマホの通知などを表示するARグラスを発売しました。バイクに取り付けたスマホの画面に目を移す必要がなく安全で快適に走れるようになります。
それでもスマホがあれば事足りる、もしくはスマホもバイクに取り付けない、というバイク乗り・自転車乗りも多いもの。
この手のスマートグラスはあると便利でしょうが、無くても困らない、というのが実情なのでしょう。生活必需品と思える機能が搭載されていなければ、なかなか普及しにくいわけです。
その通りかもしれませんが、スマホが手元にある以上、ARグラスが必需品のレベルになることはないと思われます。
スマートウォッチも、スマホを取り出して画面を見ればいいわけで、必需品とは言えません。しかしそれなりに普及はしています。むしろ高級腕時計でマウントを取るヒエラルキーマーケットをApple Watchが破壊してしまったほど意外に普及したとも言えると思います。
Apple Watchくらい違和感のないデザインで、ちょっと便利で、多くの人が買える値段のARグラスが登場すれば、LINEの通知が見られるだけでも普及するんじゃないかと思います。
要約・翻訳する最先端のAR老眼鏡はアリ
高齢化が進んでいる日本では「GPTが要約して読み上げてくれて翻訳までしてくれる最先端の老眼鏡」というのもアリじゃないかと思います。
VRゴーグルよりは日常使いするものになりますし、場合によっては命を守ることもあるARグラス、ぜひ普段使いできるものが登場してほしいと願っています。