見出し画像

OpenAI、ChatGPT Searchをリリース / Google Mapに「Gemini」を活用した新機能を導入 / Recraft、画期的な画像生成AIモデルを発表 / 「Apple Intelligence」米国で開始 / 他【AI Biweekly News #7】

こんにちは!Pomaoの佐藤です。

季節の変わり目で寒くなってきましたので体調には気をつけてくださいね!

では、2週分のAIに関するニュースをお届けします!

AIのアップデート情報や、活用事例の収集にお役立てください。


OpenAI、ChatGPT Searchをリリース

OpenAIは、今年の夏に発表したSearchGPTのプロトタイプを進化させたChatGPT Searchを発表しました。 ChatGPT Searchは、スポーツのスコア、ニュース、株価などのようなウェブからの情報や写真を、関連するソースへのリンクと共に提供します。

チャットボックスのブラウザマークを押下して「検索する」を有効にすることで使えます!有償の会員であれば使えるので、ぜひお試しください!

Google、「Grounding with Google Search」を導入

Googleは、Gemini APIとGoogle AI Studioの開発者向け機能として、Google 検索でのグラウンディングの提供を開始しました。開発者は、Google 検索の支援をうけながら、Geminiモデルからより正確で最新の情報を得られるアプリケーションを開発できる。

グラウンディングとは?

グラウンディングとは、情報や主張を信頼できる情報源や証拠に基づかせるプロセスのことで、ハルシネーションを軽減する仕組みの一つです。モデルは情報の裏付けが取れているリンクと検索提案を行なうことで、ユーザーに信頼できる情報を提供します。

Googleは、Grounding with Google Search機能をGemini APIとGoogle AI Studioに統合し、1,000クエリあたり35ドルのコストで、より正確で最新のAI回答が可能になりました!

Apple、アプリの画面上のコンテンツにSiriとApple IntelligenceがアクセスできるAPIの提供を開始

AppleがApple Intelligenceを搭載したSiriの画面認識機能のための新しい開発者向けツールの提供を開始しました。これにより、ユーザーが画面上のコンテンツについて質問したり、そのコンテンツに対してアクションを実行したい場合、SiriとApple Intelligenceはコンテンツを取得して、質問に答えたり、アクションを実行したりできる。

Apple製品を使っている方は、会話しながらリサーチや作業などを効率的に進行できるようになりそうですね!

Amazon、Prime VideoにAIを活用した要約を導入

Amazonは、AIを搭載した機能「X-Ray Recaps」の開始を発表しました。この機能は、シーズン全体、1エピソード、エピソードの一部の簡潔な要約を作成します。

ネタバレを生成しないように設定されており、好きなシリーズを存分に楽しむことができるとのことです!

Google Mapに「Gemini」を活用した新機能を導入

Google MapにGeminiを活用した新機能が導入されました!これらのアップデートは、AndroidとiOSのGoogleマップアプリで順次提供される予定です。
具体的な機能は下記の通りです!

Geminiによるインスピレーション提供

ユーザーが「友人と夜に楽しめる場所」などの曖昧な検索を行うと、Geminiが関連する場所やアクティビティを提案します。これにより、ユーザーは新しい体験を簡単に見つけることができます。

イマーシブビューの拡張

イマーシブビューが150都市に拡大され、ストリートビューや衛生画像を組み合わせてルート全体を3Dでリアルに確認できます。

ナビゲーション機能の強化

ナビゲーション中に、車線の詳細情報や高速道路の出口情報がより正確に表示され、運転時の判断が容易になります。また、電気自動車(EV)ユーザー向けに、充電ステーションの互換性や充電速度などの情報も提供されます。

Anthropic、MacとWindows用のClaudeアプリをパブリックベータ版として発表

Anthropicは、MacとWindows用のClaudeアプリをパブリックベータ版として発表しました。 アプリには、最近発表した「computer use」機能は含まれておらず、同社の最新のフラッグシップモデルであるClaude 3.5 Sonnetのアップグレード版がPC上でタスクを実行できるようになっています。

Perplexity、米国の選挙情報を提供

Perplexityが、AP通信とDemocracy Worksのデータで米国の最新選挙情報をライブで結果更新を提供していました。選挙は終わりましたが、投票権や候補者の政策も簡単に確認可能となっており、状況の確認が簡単にできました。

非常にわかりやすく、速報や政策について情報を取得でき、政治に精通していなくても概要を簡単に把握することができました。

日本においても、こういった取り組みを進めることで、若年層の政治の関心や投票率の向上などに繋げることができるかもしれないですね。

Runway、Gen-3 Alpha Turboモデル用のAdvanced Camera Controlを発表

Runwayは、Gen-3 Alpha Turboモデル用のAdvanced Camera Controlを発表しました。 この機能は、ユーザーは、パン、ズーム、強度を調整できるトラッキングショットなど、カメラの動きを正確に制御を可能にします。

Runwayとライオンズゲート社との最近の提携に続くもので、主要な映画制作への応用の可能性を示唆しているとのことです。

Recraft、画期的な画像生成AIモデルを発表

AIグラフィックデザインスタートアップのRecraftは10月30日、最新の画像生成モデル「Recraft V3」を発表しました。画像の品質が業界最高水準を達成したことで、業界内で話題となっております。画像生成リーダーボードのトップに躍り出た謎のAI「Red_Panda」であることも明らかにしました。

こちらから無料で登録、利用できるのでぜひお試しください!

町田市、全職員にChatGPT、住民向けAIナビゲーターも導入

町田市は、職員のChatGPTの活用や住民向けのAIアバターも導入と、生成AI活用を推進しています。12月からChatGPTを全職員に提供、コストは年間約1,000万円とのこと。また、住民向け「まちドア」にAIナビゲーターを設置し、AIナビゲーターで1日100回の行政手続き案内しているそうです。

コストが年間1,000万円と安くはないですが、それ以上のリターンが得られるという見込みなのでしょうか。行政は遅れているというイメージを持たれがちですが、こうした取り組みが進んでいる地域もあるので、国全体でこうした取り組みを推進していってもらいたいです!

GitHub Copilotが「Gemini 1.5 Pro」「o1-preview」「Claude 3.5 Sonnet」に対応

GitHubは10月29日、「GitHub Copilot」を、新たに「Claude 3.5 Sonnet」「Gemini 1.5 Pro」「o1-preview」「o1-mini」などのLLM(大規模言語モデル)に対応させると発表しました。

今回の対応により、開発者はニーズや特性に合わせてAIモデルを選択できるようになり、複数のモデルを活用しながら開発が可能となります。コードの補完やバグの修正など、開発者の生産性向上が期待できます。

「Apple Intelligence」米国で開始

Appleは10月28日、iPhone・iPad・Mac向けの生成AI機能「Apple Intelligence」の提供を開始しました。各OS向けに無料のソフトウェアアップデートを配信しており、英語で利用可能です。

まずは、下記の機能を提供し、順次機能の強化や新機能の提供が進行するとのことです。

  • 作文ツール

  • Siriの改善

  • 写真アプリの改善

  • メール機能の改善

  • メモ・電話アプリ、通知の要約機能

Apple、AIバグ探しに懸賞金

Appleが、AIのバグ探しに懸賞金を設定。懸賞金は5万ドルから最大1億ドルまでとのこと。

意図しないデータ漏洩を発見すると5万ドル、ユーザーのリクエストしたデータ、またはそのリクエストに関するセンシティブな情報にアクセスできると25万ドル、乗っ取り成功で100万ドルの懸賞金が獲得できます。

懸賞金の獲得は非常に難易度が高いものかと思われますので、自身のある技術者の方はぜひトライしてみてはいかがでしょうか…?

Arcade AI、テキストプロンプトからジュエリーデザインを生成するプラットフォームを構築

Arcade AIは、テキストプロンプトからユニークで高品質なジュエリーを生み出すプラットフォームを構築しました。ユーザーが生成したジュエリーのデザインを実際に職人が作り上げてそれを購入することができます。

ユニークなサービスであるものの、ユーザーが自身の欲しいものを本当に理解しているのかであったり、知らない間に盗作を作ってしまったりと懸念点はいくつかあります。

今後の動向に注目です。

洗練されたAIモデルでさえ、人間が直感的に理解できる単純なパズルを解くのに苦労

ダルムシュタット工科大学などの研究によると、GPT-4oのような高度なAI画像モデルでさえ、単純な視覚パズルを解くことができなかった。GPT-4は100問中21問しか解くことができず、Claude、Gemini、LLaVAなどの他のモデルはさらに悪い結果であった。

意外にも、人間が感覚的に理解できるパズルはAIの不得意な領域だそうです。改めて、AIが得意な領域はどんどん効率化し、不得意な領域、人間が得意とする領域に時間をかけられるように仕組みかなどしていきたいですね。


最後までお読みいただきありがとうございました!

これまでのAIニュースも含めてマガジンにまとめていますので、過去のニュースもチェックしたい方は下記よりご覧ください。

それではまた、次のAIニュースでお会いしましょう!

この記事を書いた人