![見出し画像](https://assets.st-note.com/production/uploads/images/165865840/rectangle_large_type_2_853d7cb85fc8be6b1bd953d3fcc201e9.png?width=1200)
Googleの新しいAIメガネは人工知能の未来(Android XRの解説)
4,758 文字
10年前にGoogle Glassで約束されていたものが、大失敗に終わりました。今日、Googleは Android XRという新しいプラットフォームで再び挑戦しています。これは人工知能を常に私たちの目の前に置くというものです。
コンセプトはシンプルです。あなたが見るもの、聞くものすべてを分析し、何をすべきか、どこに行くべきか、どう反応すべきかを提案するスマートグラスです。決して離れることのないパーソナルアシスタント。魅力的であると同時に恐ろしいものでもあります。アプリケーションは実用的に見えますが、倫理的な疑問が数多く存在するからです。私たちは本当に、人生の一瞬一瞬を観察し分析するAIを望んでいるのでしょうか?
これらの重要な問題について探る前に、まずはGoogleが公式デモで約束していることを見てみましょう。
「なぜ今がXRを立ち上げるのに適切なタイミングだとお考えですか?」
「コンピューティングの歴史を通じて、私たちはモニター、ラップトップ、タブレット、電話など、長方形の画面をディスプレイとして使用してきました。XRにはそれらの制限を超える力があります。今がXRに取り組むのに理想的なタイミングだと考えています。なぜなら、これらすべてのテクノロジーが収束しており、GeminiがAndroid XRを動かす上で不可欠だからです。基盤となる技術により、現実世界でするように、さまざまな種類の信号からの入力を処理することができます。XRの魔法的な点は、コンピューティングが想像できる限り自然なものへと進化することです。」
「Android XRは、ヘッドセットやグラスのための新しいプラットフォームで、開発者に最高のツールを提供しながら、障壁を減らします。私たちはGoogle Glass以来この分野に携わり、絶え間なく革新を続けてきました。Aircore、ジオスペーシャルAPI、Lens、Live View、翻訳、そして今はGeminiを開発してきました。これらの既に完璧に機能している経験を活かし、ユーザーを支援する新しい方法を見つけることができます。」
「ヘッドセットとグラスについて、私たちはヘッドセットを特定の目的のために使用するエピソディックな製品と考えています。例えば、試合を観戦している間、Geminiがフレディのグランドスラムのあらゆる側面を分析することができます。これは想像できるすべての3D空間や空間環境の最も本能的な具現化です。古いビデオを空間化できることが待ち遠しいです。まるで思い出を再体験するようになるでしょう。」
「グラスについては、一日中着用して一日を通して活用する製品と考えています。私たちの技術により、真に小型化することが可能になりました。私が現在着用しているようなウルトラポータブルなデバイスがますます増えていくでしょう。これらのグラスがあれば、どこにいても地元の住人のように感じることができます。」
「このプラットフォームを構築するには、パートナーと密接に協力する以外に方法はありませんでした。私たちはSamsungと長年協力関係にあり、それぞれの強みを組み合わせて新しいものを作り出す機会を探してきました。ハードウェアを通じて、両社のチームは一つの組織として懸命に働いてきました。」
「私たちは、開発者、デザイナー、デバイスメーカーのエコシステムとともに最高のプラットフォームを構築できることを学びました。エコシステム、プラットフォーム、ユーザーに最高のソリューションをもたらすには、深い協力が必要です。一人では速く行けますが、一緒なら遠くまで行けます。協力してこそ、それが実現できるのです。」
今ご覧いただいた動画はAndroid XRを紹介するもので、いくつかの重要なポイントがあります。まず、Googleは2種類のデバイスを区別しています。ヘッドセットとグラスです。ヘッドセットは、映画を観たり、ゲームをしたり、さらには3Dで思い出を再体験したりする特定の時間に使用するエピソディックなデバイスとして紹介されています。グラスは一日中着用するように設計されています。
印象的なのは、彼らのAIであるGeminiの統合です。デモでは環境をリアルタイムで分析し、メニューを読み、道案内をし、会話を翻訳している様子が見られます。まるであなたの目を通して世界を見るパーソナルアシスタントのようです。
Googleは相互作用の自然さを強調しています。電話を取り出したりキーボードを叩いたりする必要はなく、誰かと話すように単にグラスに話しかけるだけです。これが彼らの言う「できる限り自然なコンピューティング」です。
技術的に、このプラットフォームは長年の開発の上に成り立っています。GoogleはGoogle Glass以来の経験を振り返り、Aircore、ジオスペーシャルAPI、Google Lensなどを経て、今日のAndroid XRに至っています。
重要な点として、最初のデバイスは来年予定されているSamsungとの共同開発によるヘッドセット、Project Muanとなります。より没入感のあるヘッドセットから始めて、日常用のグラスへと移行するという興味深い戦略的選択です。
特に注目すべきは、既存のAndroidアプリケーション(YouTube、Google Maps、Google Photos)との統合に重点が置かれていることです。すべてが直接機能するとされており、これはAppleのVision Proに対する明確な競争上の優位性です。
しかし、この発表で最も印象的なのは、語られていないことです。バッテリー寿命や価格については触れられておらず、特に、すべてを見聞きするこれらのグラスによって収集されるデータがどうなるのかについても言及されていません。
今日これらを可能にしているのは、単一の革新ではなく、複数の技術の収束です。コンポーネントの小型化により、ついに通常のメガネのように見えるグラスを作ることができるようになりました。GeminiによるAIは、環境をリアルタイムで分析するのに十分な力を持つようになり、特にGoogle、Samsung、Qualcommの協力により、ハードウェア、ソフトウェア、計算能力に必要な専門知識がもたらされています。この組み合わせこそが、Google Glassのような過去の失敗との違いを生む可能性があります。
実際のアプリケーションについて話しましょう。数多くありますが、いくつかの例を挙げて本当に大きな変化をもたらす可能性があるものを見てみましょう。
聴覚障害者の方々にとって、すべての会話にリアルタイムの字幕がつくことを想像してください。口の動きを読んだり、人に繰り返してもらう必要がなくなります。デモで見られる即時翻訳は、聾者や難聴者の生活を変える可能性があります。
専門的な分野では、配管工や電気技師が手を自由に使いながら、拡張現実で技術的な図面にアクセスできることを考えてください。あるいは、患者から目を離すことなく重要なデータを見ることができる外科医のことを考えてみてください。
教育においては、革命的な可能性を秘めています。教師は学生の表情分析によってリアルタイムで理解度を把握でき、生徒はDNA分子や太陽系など、複雑な概念を3Dで視覚化できます。
日常生活では、ナビゲーションが直感的になります。知らない街で30秒ごとに電話を確認する必要はなく、視界に自然に方向が表示されます。見ている建物に関する文脈情報も得られるかもしれません。
旅行者にとっては、言語の壁がなくなります。看板やメニューを理解できるだけでなく、自分の言語を話さない人とも流暢に会話ができます。
高齢者にとって、これらのグラスは自立を維持するための貴重なツールになる可能性があります。薬の服用を思い出させたり、なくしたものを見つけたり、転倒した場合に親族に警告を送ったりすることができます。
しかし、注意が必要です。これらの期待できるアプリケーションは、すべて技術への依存に関する重要な問題を提起します。
この技術の暗部について少し考えてみましょう。数多くの懸念すべき問題があります。
まず、故障を想像してみてください。翻訳、ナビゲーション、さらには日常的なタスクを思い出すためにこれらのグラスに依存するようになった場合、技術が失敗したらどうなるでしょうか?既にGPSなしでは方向を見つけられない人がいるように、私たちの自然な能力が衰えてしまう可能性があります。
次に、個人データについて話しましょう。これらのグラスはあなたが見るものすべて、聞くものすべてを見聞きします。Googleにとっては宝の山です。このデータはどこに行くのか、誰がアクセスできるのか、どのように使用されるのか。プライバシーの問題は、ユーザーだけでなく、気付かずに撮影され分析される周囲の人々にも関わってきます。
そして、微妙な操作についてはどうでしょうか?グラスがレストランを提案する時、それは本当にあなたにとって最適な選択なのか、それともGoogleにとって最も収益性の高い選択なのでしょうか?この技術は、私企業のアルゴリズムを通して常に現実をフィルタリングすることで、私たちの世界の認識方法を再定義する可能性があります。
また、社会的影響についても考える必要があります。誰もがグラスを着用する世界で、人間関係の真正性はどうなるのでしょうか?会話の相手があなたの目を本当に見ているのか、それともディスプレイであなたに関する情報を読んでいるのでしょうか?
これらの問題は単なる理論上の問題ではありません。この技術が広く普及する前に、明確な回答が必要です。一度大規模に採用されてしまえば、その悪用を規制するには遅すぎるでしょう。
はっきりさせておきましょう。この技術は、望むと望まざるとにかかわらずやってきます。本当の問題は、それが来るかどうかではなく、どのように使用するかということです。必要なのは曖昧な規則ではなく、法的枠組みです。
正直に言いますが、私が先ほど提示したすべてのリスクにもかかわらず、私はこれをテストするでしょう。これは単なる素朴な好奇心ではありません。おそらくiPhone以来、最大の技術革命です。世界との相互作用の方法における根本的な変化について話しているのです。
スマートフォンと同じように、中毒になる人もいれば、完全に拒否する人もいて、バランスを見つける人もいるでしょう。違いは、今回は技術がポケットやデスクの上ではなく、文字通り私たちの目の前にあるということです。
だからこそ、私はこれほど危険性を強調するのです。なぜなら、もし失敗すれば、それは単に時間を浪費するアプリの問題ではなく、私たちの現実認識を根本的に変える可能性のある技術の問題だからです。
しかし同時に、その可能性について考えてみてください。言語の壁が存在しない世界、技術的な専門知識に即座にアクセスできる世界、必要な情報を探す必要なく自然に表示される世界です。
私の意見では、鍵となるのは技術そのものではなく、それを賢く使用する能力にあります。いつ着用し、特にいつ外すかを知る必要があります。人生のある瞬間は、デジタルフィルターなしの純粋に人間的なものでなければなりません。
私は最初のテスターの一人になるでしょう。しかし、目を大きく開いて、もちろんグラスなしで、テストを行います。
コメントで、あなたがその一歩を踏み出す準備があるかどうか、そしてなぜそうするのか、あるいはしないのか、ぜひ教えてください。また会いましょう。