AIエージェント搭載グーグル「メガネ型デバイス」

2024年12月13日 20:17

もうスマホを手に持って歩く必要はなくなりつつある。グーグルが先日披露したニュースによると、人々のメガネにを組み込まれた、生成AIモデルGeminiの次世代バージョンが、装着者にリアルタイムで周囲の情報を提供する。

本日公開されたデモ動画では、太い黒縁のメガネをかけた女性が、街を歩きながら目に映ったレストラン情報を評価とともに把握したり、メニューにヴィーガン色があるかどうかなどをAIにたずねて、答えてもらっている。

また別の動画では、男性が自転車に乗ってロンドン市内を探索する場面で、男性が公園沿いを走行中に場所の名前を尋ねると、AIはプリムローズ・ヒル公園だと回答した。さらに、公園の中で自転車に乗ることが許可されているかと尋ねると、「許可されていない」と回答している。また、路面を走るバスにAIを向けて、このバスは中華街に行くか？とたずねると、AIは、「はい、行きます」と答え、さらにそのバスのルートを特定した。

これら操作は主に音声ベースで行われていて、競合他社のスマートグラスのようにデジタルオーバーレイを多用するものとは異なっていルことが特徴だ。

このメガネ型端末は、グーグルの生成AIの最新バージョン「Gemini 2.0」で動作している。このAIは、ユーザーの代わりにタスクを実行するAIエージェント機能の強化に重点を置いたもの。人間の代わりにeコマースでの買い物や店の予約などを行える。

「Gemini 2.0」は私もiPhoneにアプリとして入れて使っているのだけれど、例えば、「蛋白質50グラムを摂取できる簡単なレシピを教えて」と音声で入力すると、いくつかのレシピを写真と音声で提案してくれる。

しかも英語でたずねれば英語で答えがあるし、日本語でたずねれば日本語で回答される。ちなみにアラビア語やスペイン語など様々な言語に適応しているようだ。

グーグルのメガネ型デバイスの特徴としては、Geminiの生成AIをグーグル検索やマップ、レンズの機能に統合したもので、画像認識を用いて現実世界の物体や写真内のアイテムに関する情報を引き出せる。

グーグルは、近いうちに少数のテスター向けにこのメガネを提供する予定だと述べている。ただし一般発売の時期や製品版の詳細、技術的な仕様を開示していない。「間もなくさらなる情報を発表する」と述べているだけだ。

それにしてもこのようなデバイスが実現したら、私安知の生活は一変するだろう。目の前に全く新しいAIの世界が広がって、もっと自由に、もっと便利になっていくに違いない。

AIは単なる『ツール』ではなく、もっと広義な『エージェント』なのだ。

画像引用：YouTube TheAIGRID

========================
Kindle Unlimiedで無料の拙著。レビューで応援していただけるとうれしい。

いいなと思ったら応援しよう！

サポートは株式会社スクーンジャパンおよび米国スクーン社が乳がんのNPO団体(LBBC)に寄付する資金に利用させていただきます。