見出し画像

Open AI新モデルo1をリリース/Google、AIメモアプリ「NotebookLM」に音声による概要解説機能追加/会話できるAI「Gemini Live」の無料で提供/“幻覚”に対処する「DataGemma」をリリース/Adobeビデオ編集特化の生成AI発表MetaがFacebookとInstagramの投稿をAIに学習させている/ノジマが生成AIで社長の「分身」を生み出す/Gemini「サイドパネル」で何ができる?【週刊AIのニュース 2024年9月16日号】

こんにちは。AIのある暮らしです。

2024年9月9日〜9月15日の「週刊AIのニュース」をお届けします。

みなさまのAI情報収集にご活用ください。


【1】文章生成AI

OpenAI、推論する新AIモデル「o1」を発表。規模以外での進化を示す

OpenAIは新AIモデル「OpenAI o1」を発表し、難問を段階的に解決する「推論」に重点を置いた進化を遂げたと述べています。このモデルは「Strawberry」というコードネームで呼ばれ、従来の大規模モデルのようなスケールアップを必要とせず、より論理的な推論を通じて問題を解決する能力を持っています。

また、次世代モデル「GPT-5」にはこの推論技術が取り入れられる予定です。o1は、強化学習を用いて推論プロセスを改善し、数学や化学などの問題で高い成果を示していますが、マルチモーダル解析やウェブ検索ができない制約もあります。OpenAIは、スケールアップだけでは解決できない課題を、推論を強化することで克服しようとしています。

ChatGPTに「o1」登場 じっくり考えて賢さアップ、数学オリンピック予選で8割正答 プレビュー版はきょうから

OpenAIは新たなAIモデル「o1」を発表しました。従来のモデルとは異なり、o1はユーザー入力に対して即答せず、思考の時間を設けることで複雑なタスクをより正確に解けるようになっています。国際数学オリンピックの予備試験では、GPT-4oが13%の正答率だったのに対し、o1は83%の問題に正解しました。また、安全性テストでも高評価を得ています。プレビュー版は有料のChatGPT PlusおよびTeamユーザー向けに提供され、APIでも利用可能です。

OpenAI新たなAIモデル「o1」とは?使い方や料金、ChatGPT-4oとの違いを詳しく解説

OpenAIは2024年9月12日に新AIモデル「o1」を発表しました。o1は、物理学や数学などの複雑な学術タスクで博士課程の学生レベルのパフォーマンスを発揮し、特に推論能力が強化されています。国際数学オリンピックの予選で83%の問題に正解するなど、GPT-4oに比べて大きな進歩を示しています。「o1-preview」と「o1-mini」の2種類があり、o1-miniは高速かつ安価ですが、どちらも現在はWeb検索や画像アップロードには未対応です。APIでの利用も可能です。

Google、AIの“幻覚”に対処する「DataGemma」をオープンモデルでリリース

Googleは、LLMの不正確な回答(幻覚)を軽減するためのAIモデル「DataGemma」をリリースしました。このモデルは、信頼できるデータベース「Data Commons」と連携し、外部情報を活用する「RIG」と「RAG」アプローチで推論を強化します。これにより、AIがより正確な情報を提供できるようになると期待されています。

Google、AIメモアプリ「NotebookLM」に音声による概要解説機能

GoogleはAIメモアプリ「NotebookLM」に新機能「Audio Overview」を追加しました。これにより、AIホスト2人がアップロードされたソースの内容を音声でディスカッションし、概要を説明します。現在は英語のみ対応ですが、概要を音声で聴くことで効率的に内容を把握できるようになります。

Gemini「サイドパネル」で何ができる? GoogleドライブやGmailなど具体的な活用事例

Google Workspaceに搭載された「Geminiサイドパネル」は、GoogleドライブやGmailなどでAIを活用できるツールです。例えば、Googleドライブ内の議事録の概要を一覧表示するなど、業務効率を向上させます。英語版は既に提供されており、2024年秋からは日本語版も利用可能になる予定です。この記事では、各機能の具体的な使い方が紹介されています。

複数の最新生成AIサービスを無料で体験できる、GMO教えてAIの「天秤AI」がスゴイ

GMOが提供する「天秤AI」は、複数の生成AIサービスを無料で試せるツールです。中でも便利な「壁打ち」機能は、複数のAIが生成した結果を統合・校正する機能で、効率的に内容を整えられます。特に「Perplexity」などの検索特化型AIを活用して、最新情報を効果的に収集しつつ、他のAIツールと組み合わせて使うことが推奨されています。

【2】画像生成AI

AppleのAI、しばらくは画像生成できないかも

AppleのAI「Apple Intelligence」は、iOS 18のアップデートで段階的に実装される予定です。テキスト生成や要約機能は10月から開始されますが、画像生成機能「Image Playground」や絵文字生成機能「Genmoji」は12月まで遅れる見込みです。日本での利用は来年以降が予想されています。


“著作権への配慮を徹底した”画像生成AI、日本のAIベンチャーが公開

AIベンチャーAI Picassoは、著作権に配慮した画像生成AI「CommonArt β」を公開しました。このモデルは、許可された画像データのみを使用して学習しており、日本語対応で商用利用も可能です。透明性の高い学習データを採用し、著作権侵害リスクを軽減しています。

話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは?

Black Forest Labsが開発した画像生成AI「FLUX.1」は、強力なプロンプト認識能力とクラウドサービス対応で注目されています。FLUX.1は高性能なVRAMを必要としますが、クラウドを通じて手軽に利用できる環境が整備されつつあり、Midjourneyの対抗馬として期待されています。

Stability AI の最高の画像生成モデルが Amazon Bedrock で使用可能に

Stability AI の新しいテキストから画像生成モデル(Stable Image Ultra、Stable Diffusion 3 Large、Stable Image Core)が Amazon Bedrock で使用可能になりました。これらのモデルは、複数のユースケースに対応し、フォトリアリスティックな画像やマーケティング素材を迅速に生成できます。特に、商業的利用やクリエイティブワークフローの改善に役立つと期待されています。

生成AIの「搾取」に対抗する力をアーティストに与えた研究者

シカゴ大学のショーン・シャン氏は、アーティストの作品が生成AIの訓練に無断で使われるのを防ぐため、2つのツールを開発しました。これにより、アーティストは自分の作品を守る手段を持ち、AI企業との不平等な力関係に挑むことが可能です。これらのツールは、AIの「搾取」に対抗し、個人の権利を守る重要なステップとされています。

アップルが初公開した生成AIイラスト、それはクレイグ・フェデリギの愛犬だ

iOS 18に搭載されるAI画像生成機能「Image Playground」が、初めて実際の画像として公開されました。この画像は、アップルのソフトウェア部門トップであるクレイグ・フェデリギ氏の愛犬「ベイリー」を記念して生成されたものです。「Image Playground」は、テキストプロンプトを使用してイラストやアニメーションを生成できる新機能で、今後のリリースが期待されています。

「TOKYO AI Fashion Week」コンテスト最終選考作品が集結!生成AIと人による“未来のファッションデザイン”を展示

「TOKYO AI Fashion Week 2025 S/S Contest」の最終選考作品が9月20日から22日まで表参道で展示されます。このイベントでは、生成AIと人が共創したファッションデザインが公開され、来場者は好きなデザインに投票できます。ファッション×生成AIをテーマにしたセミナーも同時開催され、最新技術の活用事例が紹介されます。

一貫したキャラクターAI動画生成が超簡単に。LoRAいらず、参照画像1枚だけでいいなんて

中国の動画生成AI「Vidu」に新機能「Reference to Video」が追加され、参照画像1枚だけで一貫したキャラクターの動画生成が可能になりました。従来のLoRAを使用した方法より手軽に、キャラクターや動物の動画を作成できるため、ストーリー性のある映像制作が大幅に簡略化されます。

支持が高い生成AIサービス 「MidJourney」「DALL-E」を上回った1位は?

日本国内の生成AIサービス利用者の満足度調査で、最も高評価を得たのはAdobeの「Adobe Firefly」で75.8ポイント。次にOpenAIの「DALL-E」と「MidJourney」が続きました。また、利用率が最も高かったのは「ChatGPT」で18.3%でした。生成AIサービスの利用者は今後も増加し、2027年には3760万人に達すると予測されています。

【3】動画・音声生成AI

作曲家・久石譲さん「生成AIに新しい曲は生み出せない」

久石譲氏は、AIが模倣しかできず、新しい音楽を生み出すことはできないと主張しています。彼は、AIがエンターテインメント業界に及ぼす影響について懸念を表明し、芸術の分野で人間が持つ創造性の重要性を強調しています。AIが進化しても、人間の芸術的価値は損なわれないと語っています。

アドビ、ビデオ編集特化の生成AI「Firefly Videoモデル」

アドビはビデオ編集に特化した生成AI「Adobe Firefly Videoモデル」の先行公開を発表しました。テキストから動画を生成する機能や、静止画をライブアクション動画に変換する機能を搭載し、商用利用も可能です。Adobe Premiere ProやAfter Effectsなどの主要製品もアップデートされ、編集作業の効率化や新しい3D機能が強化されました。

【4】モバイル・マルチモーダルAI

生成AI利用可能なiPhone16発表、20日に発売

アップルは新型iPhone「16」シリーズを発表し、全機種に独自の生成AI「アップルインテリジェンス」を搭載。メールの要約やイラスト生成などのAI機能が利用可能で、米国では英語版が秋に、日本語対応は来年予定です。最安モデルは12万4800円からで、予約は13日から開始され、20日に発売されます。

Google、会話できるAI「Gemini Live」の無料提供を開始(英語のみ)

Googleは、AI「Gemini Live」を非サブスクユーザーでも利用可能にしました。これにより、Android端末の言語設定を英語にすると、音声でGeminiと会話できるようになります。この機能は英語のみ対応しており、ユーザーは10種類の声から選択可能です。Gemini Liveは、画面右下のアイコンをタップすることで利用が開始できます。

AppleのAI新機能「Apple Intelligence」は結局「ChatGPT」と何が違うのか?

Appleの「Apple Intelligence」は、同社のOSに組み込まれるAIシステムであり、ユーザーの状況に応じて情報や機能を提供します。一方、ChatGPTは広範な質問や指示に対応できる汎用言語モデルです。両者は、処理方法、パーソナライゼーション、プライバシー対応など10の観点で比較されており、特にApple IntelligenceはAppleデバイス専用のカスタマイズ性が強調されています。

AIで何ができる!? 「Copilot+ PC」を実機レビュー!

マイクロソフトが発表した「Copilot+ PC」は、AI「Copilot」を搭載したPCです。この記事ではSurface Pro(第11世代)を実機レビューし、Copilotがどのようにユーザーをサポートするかを解説しています。例えば、Word内で簡単な指示を入力するだけで文章が自動生成されるなど、仕事や日常生活での利便性が大幅に向上する機能が紹介されています。

生成AIが入ったスマホが増えている

生成AIを搭載したスマートフォンが増えています。Appleは新型iPhoneに搭載された生成AIを使い、メール内容の短縮や絵文字の作成が可能になりました。Siriもユーザーの誤りを問題なく処理します。GoogleやSamsungも生成AI搭載スマホを提供しており、日本では2024年からiPhoneの日本語対応が予定されています。

AIが“壁紙”を自動生成するスマート冷蔵庫! AI家電をリードするサムスン

サムスンは「IFA 2024」で、AIを活用したスマート冷蔵庫を紹介しました。この冷蔵庫はディスプレイに表示される壁紙をAIが自動生成する機能を備え、音声操作で他の家電も操作可能です。サムスンは今後も冷蔵庫や洗濯機などに生成AI技術を展開し、スマートホーム市場をリードする計画です。

【5】生成AI活用事例

生成AIでカスハラ体験、富士通やソフトバンクが対策ツールを開発

富士通と東洋大学、ソフトバンクが生成AIを活用し、カスタマーハラスメント(カスハラ)対策ツールを開発しました。富士通は、カスハラをする顧客をAIが再現し、従業員が疑似体験するツールを開発。ソフトバンクは顧客の威圧的な音声を穏やかなトーンに変換する技術を導入予定で、いずれも2025年以降の製品化を目指しています。

日立が生成AIの文章を見抜く技術を開発、SNSでの活用にも期待

日立製作所は、生成AIが作成した文章を判別する技術「電子透かし」を開発しました。この技術は、文章に多重の透かしを入れることで、セキュリティを強化し、SNSや他のプラットフォームでの不正使用の防止に役立つと期待されています。LLM開発者の責任範囲が議論される中、生成AIの透明性が求められています。

生成AIの回答精度を高める「プロンプトエンジニアリング」、コスト削減にも活用

プロンプトエンジニアリングは、生成AIに与える指示文を工夫し、より精度の高い回答を得る技術です。これにより、アイデア出しやコード生成、接客シミュレーションなど、様々な業務で生成AIの効果を最大限に引き出すことが可能です。また、プロンプトエンジニアリングは、コスト削減にも役立つと期待されています。

ノジマが生成AIで社長の「分身」を生み出す、人材育成などに活用

ノジマは、社内向けに生成AIを用いたチャットサービス「Bunshin×野島廣司」を開発しました。このサービスは、社長・野島廣司氏の考え方や哲学を学習したAIが、従業員の質問に応じるもので、2024年9月から人材育成やコミュニケーションのツールとして活用されます。従業員はスマホやPCからアクセスし、野島氏の過去の講話や書籍を元にした回答を得られます。

孫正義氏の特許大量出願が話題に、知財業界の生成AI活用を展望

生成AIが特許業界に大きな影響を与えつつあり、ソフトバンクの孫正義氏が生成AIを使って大量の特許を出願したことが注目を集めています。生成AIは、特許出願のプロセスを効率化し、半導体分野を含む技術開発においても重要な役割を果たしています。今後、知財業界におけるAIの活用がさらに進むと予想されます。

ChatGPTが書いたコラムを読みたいか、AIが人のオリジナリティーを超える日

この連載では、テーマに迷った際にChatGPTにコラムを書かせる試みが紹介されています。過去に試した際、AIによるコラムは面白さに欠けたため、今回は過去の自身のコラム5本を参考にAIに新しいコラムを書かせる実験を実施。AIは「デジタルヘルスケア革命」など5つのテーマを提案しましたが、オリジナルな視点はまだ難しいとの結論に至りました。

もし今季の中日ドラゴンズに「大谷翔平」がいたら…ChatGPTが出した「順位」と「打撃成績」

ChatGPTを使って「もし大谷翔平が今季の中日ドラゴンズにいたらどうなるか?」というシミュレーションが行われ、その結果が公開されました。AIは彼の加入による打撃成績やチーム順位の変動を予測しましたが、具体的な成績や順位は記事内に記載されています。この試みはファンの興味を引き、チームの可能性を想像させるものでした。

ChatGPTでどこまで「パワポのスライド」を作れるかやってみた

ChatGPTを使ってPowerPointスライドを作成する実験が行われ、pptx形式での出力が可能であることが確認されました。文章生成や画像挿入はできるものの、デザインやレイアウトの細部調整は難しいため、現時点では叩き台としての利用が最適です。細かいデザイン変更が必要な場合は手動修正が推奨されていますが、スライドの作成自体は大幅な時短が可能です。

GitHub Copilotでテスト生成やエラー修正、LINEヤフーとサイバーの活用術

GitHubが提供するプログラミング支援ツール「GitHub Copilot」は、LINEヤフーやサイバーエージェントで導入され、エンジニアのコーディング効率を大幅に向上させています。LINEヤフーではAndroidアプリ開発での新機能実装やテスト生成に活用され、特にテストコードの自動生成に大きな効果があり、時間削減が実現されています。

Gemini の Google カレンダー拡張機能のヘルプページが公開

GoogleはGeminiを活用したGoogleカレンダーの拡張機能を発表し、そのヘルプページが更新されました。現在は英語のみ対応で、デフォルトのカレンダーイベントに基づき予定の作成や編集、キャンセルが可能です。Google Workspaceと連携することで、会話形式で予定を管理できる便利な機能も備わっています。日本語版はまだ未提供ですが、今後の展開が期待されています。

【6】生成AI業界

人間以上に人間に近づきつつあるChatGPT、OpenAI社が警鐘を鳴らしたチャットボットに対する感情的依存

OpenAI社は、GPT-4oシステムカードを発表し、生成AIがユーザーに感情的な依存を生じさせるリスクについて警告しました。AIとの会話によって人間が深い感情的つながりを感じるようになり、一部ではAIとの対話がきっかけで自殺に至った例もあります。この感情的依存が危険とされる理由は、AIの発言を鵜呑みにしてしまうリスクが高まるためです。

【現代AI童話「驚き青年」】──「生成AIはヤバすぎる最強神ツール!?」 “プロ驚き屋”にご用心

生成AIが注目される中、一部のSNSユーザー「プロ驚き屋」が誇張した表現でAI技術を紹介しています。彼らは「最強」「神」などの言葉で情報を煽り、フォロワーを増やす一方、誇張された情報に惑わされる危険性もあります。この記事では、プロ驚き屋によるトラブル事例をおとぎ話風に紹介しています。

生成AIが大企業プログラマの仕事に与える影響 マイクロソフトなど企業4800人以上を調査した結果

マイクロソフトやアクセンチュアなどの企業で行われた調査では、生成AIツール「GitHub Copilot」を使用した開発者の生産性が約26%向上したことが確認されました。特に経験の浅い開発者に大きな効果があり、若手の育成に寄与する結果が示されました。

生成AIは銀行員に代われるか? 顧客対応やコンプラチェックで進む金融業界の活用事例

金融業界での生成AI活用が本格化し、顧客対応やコンプライアンスチェックなど多様な業務にAIが導入されています。AWSのBedrock環境を使ったLLM導入が進み、AIツールのコスト削減や業務効率化が目指されています。特に顧客対応やデータ分析において、生成AIの活用が注目されています。

米グーグルAIジェミニは商標権侵害と提訴、使用禁止を請求

米グーグルのAI「ジェミニ」が商標権侵害で提訴されました。訴えを起こしたのはカリフォルニア州の小規模AI企業「ジェミニ・データ」で、自社の商標「ジェミニ」との混同を主張しています。同社はグーグルに対し、商標の使用禁止と損害賠償を求めています。米国特許商標庁は、混同の可能性があるとしてグーグルの商標登録を拒否しています。

見えてきたAppleのAI独自路線 M&Aで自社を補完

AppleはAI開発で他の巨大テック企業と異なる独自のアプローチを採用しています。同社はスタートアップ企業を6社買収し、生成AIと自社のAI技術を組み合わせてAIエージェント開発を強化。音声アシスタント「Siri」や空間コンピューティング分野での利用が進んでおり、将来的にはエージェント型AIが生活を支える存在となる見込みです。

OpenAI、増資と負債で1.6兆円の資金調達交渉

米ブルームバーグ通信は、OpenAIが総額1.6兆円規模の資金調達を交渉中と報じました。65億ドルの増資に加え、50億ドルの借入枠を設ける予定です。この資金はAI開発に必要な多額の資金を確保するためで、OpenAIの今後の成長を支える重要な動きとなります。

『イーロン・マスクを超える男 サム・アルトマン』小林雅一著

OpenAIのCEO、サム・アルトマンの人物像を描いた本書は、彼のAI開発や政治的手腕に焦点を当てています。彼はAI開発の推進者であり、マイクロソフトとの提携を通じて巨額の資金を確保し、現実的なアプローチを取っています。アルトマンの決断が今後の生成AIの未来を大きく左右することが期待されています。

NVIDIA、サカナAI出資で省エネ化に照準 半導体投資の失速に備え

NVIDIAは、日本のAIスタートアップ「サカナAI」に出資し、大株主となりました。この動きは、省エネ技術に重点を置く戦略転換を示しています。サカナAIは「脱・札束競争」を志向し、エネルギー効率を高めたAI開発を進めており、NVIDIAの将来の成長を支える重要なパートナーとなる可能性があります。

【7】SNS業界

MetaがFacebookとInstagramの成人ユーザーの投稿をAIに学習させていることが判明、ユーザーに拒否権なし

Metaは2007年以降、FacebookやInstagramの成人ユーザーの公開投稿をAI製品の学習データとして利用していることが明らかになりました。EU以外のユーザーには投稿データの使用を拒否するオプトアウトの選択肢がなく、プライバシー保護に関する懸念が高まっています。

生成AIを用いた動画の開示を求めるYouTubeの新規定、「アニメーションは対象外」で子どもたちに起きうること

YouTubeは生成AIを使用した動画にその事実を開示する新規定を導入しましたが、アニメーションは対象外となっています。このため、低品質な生成AIによるアニメ動画が子ども向けに大量に投稿されるリスクが高まり、保護者はAI生成コンテンツを自ら見分ける必要があります。

【8】おすすめ動画

【生成AI】指示の前に「前提条件」を!超有能な相談相手を使いこなす“5つの心がけ”|アベヒル

この動画では、生成AIを効果的に使いこなすための5つの基本的な心がけを紹介しています。AIに指示を出す際には、まず前提条件を明確にし、役割や文脈を与えることが重要です。AIが理解しやすい指示を与え、キャッチボールを重ねることで、より良い結果が得られます。動画内では、プロンプトの具体的な作り方やAIとの対話のコツが詳しく説明されています。

【Copilot活用術 vol.6】生成AIの精度UP プロンプトエンジニアリングを解説/Zero-ShotとFew-Shotの違い/CoT・Self-Consistency・ReActの使い分け

この動画では、生成AIの精度を向上させるための「プロンプトエンジニアリング」の技術について解説しています。具体的には、Zero-ShotとFew-Shotの違いや、上級テクニックであるCoT(Chain of Thought)、Self-Consistency、ReActの使い分けについて説明。これらを活用することで、生成AIからより精度の高い結果を得る方法を学ぶことができます。ビジネスシーンにおけるCopilotの有効な活用法を紹介しています。

生成AI活用のメリットおよび関連機能

この動画では、企業が生成AI、特に大規模言語モデル(LLM)をどのように活用できるかについて解説しています。生成AIの利点としては、ビジネスの意思決定に役立つ情報の要約、セールスリードの生成、レビューの感情分析などが挙げられます。また、LLMを効果的に活用するためのプラットフォームの機能や、ガバナンスやコスト管理の重要性についても触れられています。

生成AIの研究開発と今後の方向性 #2(コメント・Q&A)

この動画では、生成AIの研究開発における日本の取り組みや今後の方向性について議論されています。生成AIの進展には、大規模言語モデル(LLM)や半導体技術の進化が背景にあり、今後のAIの活用においては日本独自の利活用が重要視されています。また、業種特化型AIの開発や国内外での競争力強化が鍵となり、国産AI開発における課題と展望についても詳細に説明されています。

生成AIによる新しいIVRのかたち【自動応答編】

この動画では、生成AIを活用したIVR(自動音声応答)の新しい形を紹介しています。FAQを事前に学習させることで、曖昧な質問にも対応でき、適切なガイダンスを提供します。また、特定の質問についてはAIが自動で判別し、必要に応じて担当者に接続する機能も備えています。これにより、電話対応業務の効率化と音声入力だけでの迅速な対応が可能になります。

公式LINE登録で特典がもらえます


AIのある暮らし公式LINEに登録いただくと「AIの最新情報」「勉強会の募集」の案内や「本当にしごとに役立つプロンプト20選」ががもらえます。

さいごに

ここまでお読みいただきありがとうございました。

また今後もしごとや暮らしに役立つAI情報を発信していく予定ですので、アカウントのフォローをお願いいたします。

それではまた次の投稿でお会いしましょう!


この記事が気に入ったらサポートをしてみませんか?