見出し画像

ChatGPTが1位を獲った翌日にGoogle Geminiが性能トップに/Mistral AI ChatGPTを超える新機能が無料/docomo契約者GeminiやGPT-4oが無料に/Perplexityにショッピング機能/画像生成AI「FLUX.1 」の拡張モデル/「Google Gemini」のiPhoneアプリ【週刊AIのニュース 2024年11月25日号】

こんにちは。AIのある暮らしです。

2024年11月18日〜11月24日の「週刊AIのニュース」をお届けします。

みなさまのAI情報収集にご活用ください。

【1】文章生成AI

Google Gemini、ベンチマークで首位に – AIの真の実力を問う評価基準の転換点 - イノベトピア

Googleの生成AIモデル「Gemini」が、ベンチマーク「Chatbot Arena」で総合首位を獲得しました。数学や長文クエリ処理に強みを持つ一方、基本推論タスクでの誤答が課題とされています。32,767トークン対応のコンテキストウィンドウを搭載し、処理効率が向上。評価基準が「スコア重視」から「実用性重視」にシフトする必要性が議論されています。

ChatGPTの文章力が上がった

OpenAIはChatGPTの基盤となる大規模言語モデル「GPT-4o」のアップデートを発表しました。この改善により、より洗練された文章生成が可能となり、ユーザーとのインタラクションが一層スムーズになります。更新内容には、生成される文章の自然さや内容の正確性向上が含まれ、応用範囲がさらに広がると期待されています。

AIスタートアップのMistral AI、Le ChatがChatGPTを超える新機能を発表

フランスのAIスタートアップMistral AIは、チャットボット「Le Chat」に新機能を追加しました。これにより、ウェブ検索機能やCanvasツール(文書やデータ編集用の新インターフェース)、大容量データ処理、画像生成機能、AIを活用した自動化ワークフローなどが利用可能に。さらに、大規模言語モデル「Pixtral Large」は、テキストと画像の両方を処理可能で、他の主要モデルをベンチマークで上回る性能を示しています。これらの機能は無料のベータ版で提供中です。

「Gemini Advanced」に設定を記憶させるChatGPTの「メモリ」のような機能追加 - ITmedia NEWS

Googleは「Gemini Advanced」に、ユーザーの設定を記憶する新機能を追加しました。この機能では、「ベジタリアン向けレシピの提案」や「短く簡潔な回答」などの好みを保存し、応答に反映できます。同様の機能はChatGPTの「メモリ」にも搭載されていますが、Googleの設定入力は日本語対応ながら登録時に英語変換される仕組みです。現段階では、設定の反映に課題が見られます。

Mistral、チャットAI「Le Chat」に画像生成やPDF分析、Web検索などの新機能追加 - ITmedia NEWS

仏AI企業Mistralは、AIチャットボット「Le Chat」に新機能を追加しました。新たにWeb検索、画像生成、大規模PDF分析が可能となり、マルチモーダルAIモデル「Pixtral Large」も発表されました。このモデルは複雑なドキュメントや画像を処理し、テキストやグラフ、数式を含む高度な分析を提供します。Le Chatのβ版は無料で利用可能で、日本語にも対応しています。

Claude、Googleドキュメントをサポート(Impress Watch) - Yahoo!ニュース

AnthropicのAIモデル「Claude」がGoogleドキュメントとの連携機能を発表しました。この機能は有料プラン「Claude Pro」「Team」「Enterprise」で利用可能で、Googleアカウントを連携させることで使用できます。ドキュメントのURLを貼り付けるか、最近使用したファイルから選択して読み込む仕組みです。ただし、Googleスプレッドシートやスライドには未対応です。

【2】画像・動画生成AI

Black Forest Labs、高性能AI画像編集ツール群「FLUX.1 Tools」を公開 | XenoSpectrum

Black Forest Labsは、画像生成AI「FLUX.1」を拡張する新しいツール群「FLUX.1 Tools」をリリースしました。これには以下の4つのツールが含まれます:

  • FLUX.1 Fill: テキストプロンプトに基づくインペインティングやアウトペインティングが可能。

  • FLUX.1 Depth: 画像の深度マップを活用して精密な編集を実現。

  • FLUX.1 Canny: エッジ検出を活用して画像構造を保持。

  • FLUX.1 Redux: 入力画像の本質を維持しながらスタイル変更。

これらツールはプロフェッショナル向けと開発者向けのバージョンで提供され、GitHubやHugging Faceなどでオープンソースとしても利用可能です。また、商用APIとしても利用でき、多様な画像編集ワークフローに対応します。

高品質画像生成AI「FLUX」向けの拡張AIモデル「FLUX.1 Tools」登場、「生成拡張」「深度抽出」「被写体維持してスタイル変更」などが可能 - GIGAZINE

画像生成AI「FLUX1.1 [pro]」に対応する新たな拡張モデル「FLUX.1 Tools」が発表されました。このシリーズには、インペインティングやアウトペインティングを可能にする「FLUX.1 Fill」、深度抽出が行える「FLUX.1 Depth」、輪郭抽出を行う「FLUX.1 Canny」、被写体を維持してスタイル変更を行う「FLUX.1 Redux」の4種類が含まれます。それぞれの機能は、従来モデルを上回る品質で画像編集を実現します。

アドビ、コンテンツ制作ツール「Adobe Express」のiPadアプリを提供 生成AIで瞬時に画像を作成可能 - ITmedia Mobile

アドビは、コンテンツ制作ツール「Adobe Express」のiPadアプリ提供を開始しました。このアプリでは、生成AI「Adobe Firefly」を活用し、画像の生成、オブジェクトの削除や挿入、テキスト効果の追加が可能です。参照画像を使用してスタイルや構成を指定すると、生成画像の精度を高められます。これにより、ユーザーは効率的に高品質なデザインを作成できるようになります。

話題の動画生成AI「Kling」にアプリ版が登場。動画の続きを最長3分間生成(36Kr Japan) - Yahoo!ニュース

中国の快手科技(Kuaishou Technology)は、独自の動画生成AI「Kling」を基にしたアプリ「KLING AI」をリリースしました。このアプリは、テキストや画像から動画を生成し、最長3分間の動画続きを生成する機能を提供します。解像度は720ピクセルと1080ピクセルのバージョンがあり、公開以来10回の改良を経て、360万人以上のユーザーを獲得しています。

【AI動画生成機能】テキストから動画を自動作成!HitPaw Edimakorの使い方 | HITPAW CO.,LIMITEDのプレスリリース

「HitPaw Edimakor」は、AIを活用して簡単に動画編集や生成が行えるツールです。新たに追加されたAI動画生成機能では、テキスト入力だけでキャラクターのリップシンク動画を作成可能。豊富なキャラクター選択やカスタムアバター作成機能も搭載しています。リーズナブルな料金設定で、個人やビジネス用途に対応。現在、ブラックフライデーセールで最大40%OFFのキャンペーンも実施中です。

【3】モバイル・マルチモーダルAI

Perplexityにショッピング機能 写真から検索・購入 - Impress Watch

AI検索エンジンPerplexityは、写真を用いた商品検索から購入までを可能にするショッピング機能を米国で開始しました。有料プラン「Buy with Pro」契約者向けに提供され、配送先や支払い情報を登録すれば、検索結果から直接購入できます。また、「Snap to Shop」機能では、商品の写真を撮影してアップロードすると関連商品を表示するビジュアル検索が可能。Shopifyとの連携により、米国の多くの商品が対象となり、今後は他国市場への展開も計画されています。

「Google Gemini」のiPhoneアプリがついに登場!友だちと会話する感覚でAIに疑問や雑談を投げかけちゃお - isuta(イスタ)

Googleが開発したAIアシスタント「Google Gemini」のiPhoneアプリがリリースされました。これにより、iPhoneユーザーも自然な会話を通じて文章作成やスケジュール提案などのAI機能を活用可能に。特徴的な「Gemini Live」では、まるで友達と話す感覚で雑談や質問ができるほか、「Google マップ」や「YouTube」との連携機能も利用できます。音声トーンも選べるため、親しみやすさが魅力です。

ドコモ契約者はGeminiやGPT-4oなど1年無料「Stella AIセット割」 - Impress Watch

NTTドコモは生成AIサービス「Stella AI」を12月1日より提供開始し、「Stella AIセット割」により契約者に1年間無料で利用できるプランを導入します。このサービスはGoogleの「Gemini」やOpenAI「GPT-4o」など複数のAIモデルを搭載し、初心者でも簡単に利用可能。テンプレートを活用したシンプルな操作で、iOS/AndroidアプリやWebブラウザを通じて利用できます。さらに、一部のドコモショップでは生成AI講座の実施も予定されています。

ChatGPT、Web版で「高度な音声モード」開始 - Impress Watch

OpenAIはChatGPTのWeb版に「高度な音声モード」の提供を開始しました。この機能は、音声入力での質問に対して自然な音声で回答できるもので、トーンや話者の感情、背景ノイズを認識する高度な能力を持ちます。これまではモバイルおよびデスクトップアプリで利用可能でしたが、今回のアップデートでWeb版にも対応し、有料プラン利用者に順次展開されます。

OpenAIはChatGPT搭載ブラウザでGoogleに対抗することを検討している - GIGAZINE

OpenAIは、ChatGPTを統合したウェブブラウザの開発を検討しており、Googleの支配的な検索市場に挑む意向を示しています。この動きは、米司法省がGoogleにChromeの売却を求める中で注目されています。Googleの主要パートナー関係への影響やAlphabetの株価下落も話題となっています。また、OpenAIはSamsung製デバイスへのAI機能搭載も模索中と報じられています。

「Apple Intelligence」でできること 英語版を使って見えた、次世代「AIアシスタント」の実力(ITmedia NEWS)

Appleは、オンデバイスAI「Apple Intelligence」をiPhone、iPad、Mac向けに提供開始しました。利用には英語設定が必要で、AI処理はプライバシーを重視したデバイス内で完結します。クラウドに情報を蓄積せず、個々のデバイスでの独立した学習が特徴です。多機能なAIを全製品に統合し、プライバシー保護を優先するAppleの姿勢が際立ちます。

「iPhoneでGoogle AIを活用しよう」 iOS用Geminiアプリ公開、会話できる「Live」も - ITmedia NEWS

Googleは、iOS用「Gemini」アプリをApp Storeで公開しました。音声やテキストで質問や会話ができ、画像生成機能「Imagen 3」も利用可能です。特に「Gemini Live」では10種類の音声を選べ、自然な会話を楽しめます。YouTubeやGoogleマップなどの関連情報も検索可能で、Googleサービスと連携した幅広い活用が期待されています。

【4】生成AI活用事例

アバター遠隔接客サービス「KSIN」、ChatGPT-4oと連携し、無人で一次対応が可能なAIアバター接客機能をリリース

デジタル・フロンティアとユニキャストは、アバター遠隔接客サービス「KSIN」を共同開発し、新たにChatGPT-4oを活用したAIアバター機能を追加しました。この機能により、無人で自然な会話による一次対応が可能となり、接客業務の効率化が期待されます。AIと有人のハイブリッド対応が可能で、アバターは表情や動きをリアルタイムで反映し、人間らしい接客体験を提供します。

ChatGPTの可能性を広げる 効果的なプロンプトの使い方と事例紹介 | CREATIVE VILLAGE SEMINAR

2025年1月9日、クリーク・アンド・リバー社はChatGPTをテーマにした無料ウェビナーを開催します。このイベントでは、ChatGPTの基本操作やプロンプト活用の工夫、ビジネスや日常生活での応用事例について解説されます。田村憲孝氏が登壇し、AIに対する漠然とした不安を解消し、効果的な使い方を指南します。AIが与える影響や安全な利用方法についても触れる内容です。

生成AIが歴史地震研究に一役? 崩し字に残された震度判定のヒント:朝日新聞デジタル

生成AIが歴史地震研究に活用されようとしています。東京大学の研究者は、古文書や日記などの記録から震度を推定するプロセスをAIで自動化し、定量化することを目指しています。この技術により、従来は判定が困難だった中小地震についても範囲や規模を分析できる可能性があります。地名から位置情報を割り出し、地図上に震度情報を可視化する取り組みも進行中です。

生成AI、小売りの広告網を拡大 顧客データを駆使 - 日本経済新聞

生成AIが小売業界の広告網拡大に貢献しています。企業は顧客データを活用し、個々の好みに合わせた広告コンテンツを生成して最適なタイミングで配信することで、リテールメディアネットワーク(RMN)の活用を強化しています。大手企業はAI分析を通じて広告費の最適化やパーソナライズ化を進める一方で、プライバシーや広告費配分の課題も浮上しています。

「医師の働き方改革」に向け生成AIが起こすイノベーションの中身 - DIGITAL X(デジタルクロス)

医師の働き方改革において、生成AIの活用が注目されています。日本マイクロソフトは、AIによる記録作成や書類整理の効率化を提案。生成AIは医療現場での負担軽減に役立つ可能性が高いとされています。さらに、生成AIを活用した報告書要約やアイデア出しの支援など、医療データの機密性を守りつつ業務効率を向上させる方法が議論されています。

デジタル庁AI担当者が語る、生成AI利活用における「4つの観点・9つの留意点」 その軽減策とは? | EnterpriseZine

デジタル庁は生成AIの活用ガイドブックを公開し、リスクと対策を示しました。「品質」「コスト」「スコープ」などの観点で留意点を整理し、精度の過剰要求やバージョン更新時の影響への対応を提案。さらに、不足知識の補填にはRAG(情報取得を活用した生成)が有効とされています。これらはAI導入企業に効率的な活用とリスク軽減の手引きを提供します。

ローソン全社員が生成AI活用 アイデア壁打ちや会議要約 - 日本経済新聞

ローソンは本社の全社員約4000人が生成AIを活用できる体制を整備しました。商品開発のアイデア創出や会議要約、メール作成に生成AIを活用することで、業務時間を大幅に短縮できるとしています。AI導入はKDDIグループの一環として進められ、従業員が効率的に創造的作業に集中できる環境作りを目指しています。

マンガ生成AIのGAZAIがマンガを簡単につくれるサービス「GAZAIマンガビルダー」をリリース! マンガコンテストを開始!(2024年11月23日)|BIGLOBEニュース

株式会社GAZAIは、誰でも簡単にマンガが作れる「GAZAIマンガビルダー」をリリースしました。同時にマンガコンテストを開催し、優勝者には3万円分のAmazonギフト券を授与します。コンテストは2024年11月23日から29日まで開催され、生成したマンガをSNSで投稿し投票を受ける形式です。参加にはGAZAIへの登録が必要で、生成画像に吹き出しを用いることが条件です。

オープンAI、教師向けに無料AI活用講座 教育支援を強化 | ロイター

OpenAIは、NPO「コモン・センス・メディア」と連携し、AIとプロンプト作成を解説する教師向け無料トレーニングコースを開始しました。このコースは、幼稚園から高校の教師を対象に、授業計画の作成や会議効率化など、AIを教育現場で活用する方法を提供します。これにより、教育におけるAIの責任ある利用を支援し、技術への理解を深める取り組みが進められています。

【5】生成AI業界ニュース

アマゾン、生成AI手掛けるアンソロピックに40億ドル追加投資 | TBS CROSS DIG with Bloomberg

アマゾンは、生成AIを開発するスタートアップ企業アンソロピックに対して、40億ドル(約6200億円)の追加投資を発表しました。この投資により、アンソロピックはアマゾン・ウェブ・サービス(AWS)のデータセンターやAIチップを活用することになります。同社のAIチャットボット「クロード」は、テキスト生成や高度な推論能力で注目されています。アンソロピックは2021年にOpenAIの元従業員によって設立されました。

OpenAI、ブラウザー開発検討と米報道 Googleに挑戦 - 日本経済新聞

OpenAIが独自のウェブブラウザーの開発を検討していると報じられました。Googleの「Chrome」事業に対する米司法省の売却要請が背景にあり、OpenAIの参入はGoogleの地位を揺るがす可能性があります。ブラウザー市場はスマートフォン主体へ移行しており、広告収益が限定的なOpenAIにとって、戦略的な判断が問われています。

ASCII.jp:キラーアプリ不在の生成AIブーム、チャットの次は何が来る?

生成AIはここ数年で大規模なブームとなっていますが、未だ決定的な「キラーアプリ」が登場していません。代わりに、音声や動画を組み合わせたマルチモーダルAIが注目を集めています。Googleの「NotebookLM」や「Make-A-Video」などのツールは、AIを活用した新たな応用例として脚光を浴びています。今後、AI業界はコンテンツ生成の質向上に加え、収益化への圧力も高まると見られます。

マイクロソフトのCopilotを導入したら、経営陣の受信ボックスが社員から突然丸見えに。懸念広がる | Business Insider Japan

マイクロソフトのAIアシスタント「Copilot」が、機密情報を組織内で過剰に共有する問題を引き起こし、顧客企業で懸念が広がっています。CEOのメールや人事関連文書などの機密情報が意図せず共有されるインシデントを受け、マイクロソフトは緩和ツールやガイドを提供し対応を進めています。この問題は、導入を見合わせる企業も出るなど、AIの情報ガバナンスへの課題を浮き彫りにしています。

生成AI、「幻滅期」入りでバブル崩壊か 開発競争の軸はインフラ構築に:日経ビジネス電子版

生成AIは2025年、「幻滅期」に突入するとされ、株式市場でのAIバブル崩壊が懸念されています。高額な投資に見合う収益が見込めない現状で、有力なサービスがまだ生まれていないことが課題です。一方で、データセンターや電力といったインフラ構築が今後の競争の鍵となると指摘されています。また、資金難により新興AI企業の統廃合が進み、大手企業による吸収合併が加速する見通しです。

Web検索にも生成AIが浸透。コンテンツは誰のもの?(マイナビニュース) - Yahoo!ニュース

OpenAIが新たに開始した「SearchGPT」は、ChatGPTにウェブ検索機能を統合したサービスで、GoogleやMicrosoftに続き、生成AIと検索市場の統合が進展しています。しかし、検索結果におけるコンテンツの著作権や、広告ビジネスとの関係が議論を呼んでいます。企業や組織は、知財問題やステルスマーケティングへの懸念から、生成AIの導入に慎重な姿勢を見せています。

エヌビディアCEO、グーグルの「NotebookLM」に夢中--背景にはAI推論への期待 - ZDNET Japan

NVIDIAのジェンスン・フアンCEOは、Googleの情報整理ツール「NotebookLM」を愛用していると明かしました。このツールは文書の要約やチャット形式の応答、音声会話作成を可能にします。フアン氏は、企業が社内でAI推論を活用する未来を期待しており、NVIDIAの最新GPUアーキテクチャ「Blackwell」がAI推論の需要を支えると強調しています。

【エヌビディアCEO×孫正義】世界初のAIグリッド構想「一人一人にAIエージェントが」「日本も波に乗れ」「エヌビディア買収を3度打診した」 | TBS CROSS DIG with Bloomberg

NVIDIAのジェンスン・ファンCEOとソフトバンクの孫正義会長が「AIサミットジャパン」で対談しました。ファン氏は「AIグリッド」の構想を提唱し、すべての人にAIエージェントを提供する未来を展望。孫氏は日本がAIの波に乗る必要性を強調し、過去にNVIDIAの買収を試みたことも明かしました。この対談は、AIが社会や経済に与える影響を深く探る内容となっています。

【6】SNS業界ニュース

YouTube、2024年の年間ハイライトを発表 あなたが最も視聴した音楽やゲーム実況は? - KAI-YOU

YouTubeは2024年のユーザー活動を振り返る「年間ハイライト」を公開しました。この機能では、音楽とゲームジャンルの動画視聴統計を確認可能です。視聴したゲーム実況者やゲームタイトル、よく聴いた音楽やアーティストがランキング形式で表示されるほか、自分の視聴データをSNSで共有できます。音楽ではプレイリストの自動生成、ゲームジャンルでは「ゲーマーカード」も提供され、注目を集めています。

X(旧Twitter)でAIに文章や画像を学習させないようにする方法は?(篠原修司) - Yahoo!ニュース

X(旧Twitter)は、AI「Grok」の学習に投稿を利用していますが、設定でこれを拒否できます。「プライバシーと安全」の項目から「Grokでのトレーニング利用を許可」のスイッチをオフにするか、アカウントを非公開にすることで対応可能です。ただし、他者によるAI学習の可能性は残るため、ウォーターマークの活用が推奨されています。デマ情報には注意が必要です。

【7】おすすめ動画一覧

【すべての人が生成 AI をつかいこなす時代へ】 Gemini 超実践術 / 日常も、ビジネスも、開発も加速 / Google Workspace / Vertex AI

Googleが開発した生成AI「Gemini」は、日常生活やビジネス、開発プロセスの効率化を目指した最先端の技術です。この動画では、Google Cloudの中井悦司氏が、Geminiの多様な用途と可能性を解説。メールの優先順位付け、履歴書の要約、プロモーション資料の生成など、日常業務での具体的な利用例を紹介しています。また、AIを「すべての人に役立つもの」とするGoogleのビジョンと、その技術的基盤についても触れています。

生成AIはデータが全て!~社内やクラウドのデータがもつ価値を引き出す方法~

この動画では、日立とAWSの協力による生成AIとハイブリッドクラウドの最新技術について解説されています。データの一元化と活用を通じて、企業が効率的かつ革新的な方法でビジネス価値を引き出すアプローチが紹介されました。生成AIを活用したクラウド基盤の事例や、データ活用を促進するための具体的なステップについても詳しく説明されています。

クリエーターの敵か味方か!? #生成AIとクリエイティブについて考える /境 祐司

このセミナーでは、Adobeの取り組みを例に生成AIがクリエイティブ業界に与える影響について議論されました。生成AI技術がクリエイティブの概念をどのように変え、PhotoshopやIllustratorを含むデザインツールの利用方法にどのような変化をもたらしているかが解説されました。特に、デザインの敷居を下げる一方で、クリエイターとしての立場を再考する必要性についても語られています。


生成AIの進化:日本企業はどのように活用すべきか?

PwCのグローバルAIリーダー、スコット・ライケンズ氏が、生成AIのグローバルトレンドとリスクアプローチ、そして日本企業が取るべき行動について解説しました。生成AIは、単なる効率化ツールにとどまらず、ビジネスプロセスの見直しや創造的な取り組みにも影響を与えています。一方で、日本企業のリスク回避傾向が普及を遅らせていることが指摘され、リーダーシップの教育や実験的な導入が必要とされています。


日経クロストレンドで6冠を達成したGPTs全6作品はこちら

さいごに

ここまでお読みいただきありがとうございました。

また今後もしごとや暮らしに役立つAI情報を発信していく予定ですので、アカウントのフォローをお願いいたします。

それではまた次の投稿でお会いしましょう!


いいなと思ったら応援しよう!