GoogleのAIが、Gmailや写真などとどのように連携するかについて、驚くべきビジョンを披露。
CNNはのサマンサ・マーフィー・ケリー(Samantha Murphy Kelly, CNN)は2024年05月14日に、OpenAIが驚くほど改善されたChatGPT AIモデルに感銘を受けた翌日、Googleは、何十億人もの人々が毎日使用する製品をAIがどのように改善するかについて、同様に驚くべきビジョンを披露したと報告した。
年次Google I/O開発者カンファレンスで発表された今回のアップデートは、Googleが新しいデバイスとAIを活用したツールで中核となる広告ビジネスを超えて前進しようとしている中で行われた。
イベントでは人工知能が非常に注目され、Google CEOのサンダー・ピチャイ(Google CEO Sundar Pichai)はプレゼンテーションの最後に、「AI」という言葉が120回言われたと述べた。他ならぬGoogleのAIプラットフォームGeminiで数えた。
基調講演中、Googleは、情報の共有、他者との交流、家中の物体の検索、スケジュールの作成、ショッピング、Androidデバイスの使用などによって、自社のAI製品がユーザーの生活のより大きな部分になることをどのように望んでいるかを示した。
Googleは基本的に、自社のAIがユーザーのあらゆる行動に組み込まれることを望んでいる。
つまり、個人情報の枠を超え、その周辺まで予測する。
ピチャイは、最新のAIモデルGemini 1.5 Proを活用したさまざまな新機能を強調してイベントを開始しました。
「Ask Photos」と呼ばれる新機能の1つを使用すると、保存された写真を確認することで、娘がいつ泳げるようになったのかを尋ねたり、ナンバー プレートの番号を思い出したりするなど、写真を検索してより深い洞察を得ることができる。
また、ユーザーがGemini 1.5 Proに添付ファイルを分析し、重要なポイントを要約してアクション・アイテムを吐き出すことで、子供の学校からの最近のメールをすべて要約するよう依頼する方法も示しました。
一方、グーグル幹部らは交代で、最新モデルがどのように教科書を「読み」、それを自然な話し方の教師が質問に答える一種のAI講義に変えることができるかなど、他の機能を実演した。
ちょうどその前日、人工知能におけるテクノロジー業界のリーダーの1つである OpenAI は、チャットボット「ChatGPT」をよりスマートで使いやすくする新しいAIモデルを発表した。
「GPT-4o」は、ChatGPTをデジタル パーソナル アシスタントに変え、リアルタイムで音声による会話を行い、テキストと「視覚」を使用して対話できるようにすることを目的としている。ユーザーがアップロードしたスクリーンショット、写真、文書、グラフを表示し、それらについて会話することができる。
Googleはまた、ChatGPTの取り組みへの直接の反応として、さまざまな種類の入力を取り込むGeminiの最新機能、つまりテキスト、音声、画像を取り込む「マルチモーダル」機能を披露した。
また、Google幹部は、ToDoリストの管理、データの整理、ワークフローの管理を支援する仮想「チームメイト」のデモも行った。
Googleはまた、ユーザーがより自然な、またはより焦点を絞った質問をできるようにし、詳細な結果や要約された結果など、さまざまなバージョンの回答を提供することによって検索が改善されたことも強調した。
また、特定の場所にある子供向けのレストランを勧めるなど、対象を絞った提案を行ったり、Google レンズで問題のビデオを撮影してカメラなどのガジェットの問題点を指摘したりすることもできます。 同社によると、目標はGoogleでの検索にかかる手間を省くことだという。
同社はまた、GoogleのDeepMind AIラボが開発したProject Astraを簡単にからかった。
これにより、AIアシスタントは携帯電話のカメラを使用して物体を識別したり、置き忘れたアイテムを見つけたりするなど、現実世界に関する情報を解釈することでユーザーの日常生活を支援できるようになる。また、拡張現実メガネでどのように機能するかについても示唆された。
しかし、それらは異次元になった検索エンジンであり、残念ながら、AIではない。
Googleは、今年後半にさらに多くのAI機能を携帯電話に統合すると発表した。 たとえば、ユーザーはAIによって作成された画像をGoogleメッセージやGmailにドラッグ・アンド・ドロップしたり、Androidデバイス上のYouTubeビデオやPDFについて質問したりできるようになる。
そして、多くの人にとって魅力的と思われる動きとして、Android用の新しい組み込みツールは、ユーザーの銀行を模倣しようとする詐欺師など、通話中に不審なアクティビティを検出するのに役立つ。
市場調査会社イーマーケッターのアナリスト、ジェイコブ・ボーン(According to analyst Jacob Bourne, from market research firm Emarketer)によると、今年のGoogle開発者カンファレンスでAIが注目を集めたのも不思議ではないという。
「最新モデルと、それが強力な消費者リーチで既存の製品を強化する方法を紹介することで、Googleは競合他社と効果的に差別化できることを実証している。」とジェイコブ・ボーンは述べた。
ジェイコブ・ボーンは、新しいツールが受け入れられるかどうかは、Googleが自社の検索製品を生成型AI時代の需要にどれだけ適応できるかを示す指標になると信じている。
ジェイコブ・ボーンは、「競争力を維持し、投資家を満足させるには、Googleは自社のAIイノベーションを収益性の高い製品やサービスに大規模に転換することに注力する必要がある。」と述べた。
つまり、それで稼ぐことができるかに掛かっている。
同社はAIのフットプリントを拡大するにつれ、潜在的な悪用を減らすためにさらに多くの保護機能を導入すると述べた。 Googleは、AIが生成したコンテンツを検出できるように既存の SynthID 機能を拡張しています。昨年、このツールはAIが生成した画像と音声に透かしを追加した。
Googleはまた、専門家や機関と提携して新モデルの機能をテストし、改善していると述べた。
Googleは昨年、人工知能の導入を倍増させてきたが、大きな障害にも直面した。 昨年、その生成AIツール(当時はBardと呼ばれ、その後Geminiと改名された)を発表した直後、同ツールのデモビデオでジェームズ・ウェッブ宇宙望遠鏡に関する質問に対して事実と異なる回答が得られたことが示され、Googleの株価は下落した。
最近では、Geminiが白人の代わりに有色人種を主に映していた歴史的に不正確な画像を作成したとしてソーシャルメディアで非難された後、Googleは2月に人物の画像を生成する機能を一時停止した。
Gemini は、ChatGPTなどの他のAIツールと同様に、膨大なオンライン,データでトレーニングされる。専門家らはかねてから、不正確さ、偏見、誤った情報の拡散の可能性など、AIツールに関する欠点について警告してきた。それでも、多くの企業が AI ツールやパートナーシップの開発を進めている。
その原因は、データの整合性の欠陥にある。Googleが検索エンジンで、行なってきたような何でも集めれば良いという次元ではなくなっている。
つまり、データの質になる。良質の膨大な情報を集めないと、AIは暴走する。少ないと焦点がぼける。
どこかから盗んできたデータで作ったAIはデータのゴミ箱である。
それでも検索エンジンの枠を超えていない。
Appleは、チャットボットやその他のAIツールを含むGoogleのGemini AIエンジンをライセンス供与して、次期iPhoneとiOS 18の機能に組み込むことに興味を持っている可能性があるとブルームバーグが3月に報じた。 同社はChatGPTの作成者OpenAIとも話し合っていると伝えられている。
https://edition.cnn.com/2024/05/14/tech/google-ai-gmail-photos-developers-conference/index.html
https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/
https://www.cnn.com/2023/02/08/tech/google-ai-bard-demo-error/index.html
https://www.bloomberg.com/news/articles/2024-03-18/apple-in-talks-to-license-google-gemini-for-iphone-ios-18-generative-ai-tools?srnd=undefined&sref=9hGJlFio
https://www.reuters.com/technology/openai-plans-announce-google-search-competitor-monday-sources-say-2024-05-09/
https://www.reuters.com/technology/openai-says-chatgpt-can-now-browse-internet-2023-09-27/
https://www.reuters.com/technology/google-expected-unveil-its-answer-microsofts-ai-search-challenge-2023-05-10/
https://www.similarweb.com/blog/insights/ai-news/chatgpt-rebuilds/
https://www.cnbc.com/2024/05/14/google-io-2024-ai-gemini.html
https://www.cnn.com/2024/05/14/tech/google-ai-gmail-photos-developers-conference/index.html
https://www.nikkei.com/article/DGXZQOGN147B10U4A510C2000000/?n_cid=NMAIL007_20240515_A
https://www.asahi.com/articles/ASS5G7XJ3S5GUHBI008M.html