見出し画像

ChatGPTの新機能「Canvas」/「ChatGPT Plus」を倍以上に値上げ!?/Google検索「AIによる概要」に広告表示へ/人気の画像生成AI、最新版「FLUX 1.1」発表/「Sora」の共同リーダーがGoogle入り/OpenAI、9600億円調達 NVIDIAやソフトバンクグループが投資【週刊AIのニュース 2024年10月7日号】

こんにちは。AIのある暮らしです。

2024年9月30日〜10月6日の「週刊AIのニュース」をお届けします。

みなさまのAI情報収集にご活用ください。


【1】文章生成AI

ChatGPT、回答を見ながら修正できる新機能「Canvas」

OpenAIは「ChatGPT」に新たな機能「Canvas」を導入しました。この機能は、ChatGPTが生成したコードやテキストをサイドパネルで確認しながら、リアルタイムで修正・改善できるインターフェースを提供します。現在、ChatGPT PlusとTeamユーザーが利用可能で、将来的にはすべてのユーザーに提供される予定です。この新機能により、ライティングやコーディングの効率が向上し、特にコードのレビューやバグ修正において大きな効果が期待されています。

ChatGPTの進化した「音声モード」同士で会話させてみたらどうなるの?

OpenAIは、ChatGPTの新しい高度な「音声モード」を公開しました。この機能は、声のスピードやトーンを認識し、より自然な会話が可能です。また、音声の種類を選び、感情を込めた返答も可能になっています。現在は有料ユーザー向けに提供されており、今後はすべてのユーザーに展開予定です。音声モード同士での会話では、AIが過去のやり取りを基に応答することもあり、少し奇妙な会話が生じることもあります。

OpenAI、「ChatGPT Plus」を倍以上に値上げ!? すでに高すぎるのに…

現在月額20ドルの「ChatGPT Plus」が、今後数年間で44ドルにまで値上げされる可能性が報じられました。OpenAIの収益は増加していますが、運営費用や損失を補うためにさらなる収益が必要です。これにより、ユーザーからの反発が懸念される一方で、コスト圧力が背景にあることが示されています。

Excel操作をプロンプトで実行できる「Copilot」の実力は?

MicrosoftのAIアシスタント「Copilot」は、Excelの操作をプロンプトで指示することで、データ処理やグラフ作成、関数の実行が可能です。従来のExcel操作では関数や機能を調べて使う必要がありましたが、Copilotに指示を出すだけで実行可能になり、効率化が期待されています。しかし、正確な指示を出すにはトレーニングが必要です。

Googleが従来のモデルよりさらに小型で高速な「Gemini 1.5 Flash-8B」をリリース、価格は50%低くなり遅延も軽減

Googleは、軽量かつ高速なAIモデル「Gemini 1.5 Flash-8B」をリリースしました。従来の「Gemini 1.5 Flash」と同等の性能を保ちながらも、価格は50%低く抑えられ、遅延が軽減されています。開発者向けのコスト削減が強調されており、今後のプロンプト処理も効率化される見込みです。

ローカルで動作するスマホ向けAI「Gemini Nano」を開発者が自分のアプリに組み込めるように

Googleは、スマホ向けAI「Gemini Nano」を開発者がアプリに統合できるようにしました。これにより、ユーザーデータを外部に送信することなく、ローカルでAIを活用できるようになります。さらに、新しいシステム「AICore」を活用することで、プライバシー保護が強化され、データが他アプリに公開されるリスクが軽減されます。

Google「メッセージ」アプリでGeminiと日本語で会話可能に

Googleの「メッセージ」アプリで、AIチャットボット「Gemini」と日本語で会話する機能がPixel 9 Proで利用可能になりました。Geminiとの会話は、一般的な質問やメッセージの下書き作成、画像を基にした質問にも対応しています。RCSチャットが有効で、6GB以上のRAMを搭載したAndroid端末が必要です。

Googleの「AIによる概要」に正式に広告が掲載されるように

Googleは、検索結果の「AIによる概要」に広告を導入することを発表しました。これにより、ユーザーが関連する製品やサービスを簡単に見つけられるようにすることを目指しています。この機能は2024年8月に日本語にも対応し、現在はアメリカのモバイルユーザー向けに展開されています。

Google検索の「AIによる概要」と「Googleレンズ」にも広告表示へ

Googleは、検索結果の「AIによる概要」と「Googleレンズ」に広告を表示すると発表しました。この広告は、モバイルユーザー向けにまずアメリカで展開され、年末までにGoogleレンズでも一部の国で表示が開始されます。広告には「Sponsored」ラベルが付き、関連商品やサービスを促進します。

【2】画像・動画生成AI

人気の画像生成AI、最新版「FLUX 1.1」発表 「Blueberry」として話題のモデル

BlackForestLabsは新たな画像生成AIモデル「FLUX 1.1 [pro]」を発表しました。このモデルは前バージョンに比べて6倍の速度で画像を生成し、画質や多様性も向上。APIを通じて開発者向けに提供され、1画像あたり約6円という低価格で利用可能です。

Stable Diffusionのオリジナル開発陣によるAI企業「Black Forest Labs」が画像生成AI「FLUX1.1 [pro]」をリリース

Black Forest Labsは、次世代画像生成AI「FLUX1.1 [pro]」をリリースしました。前モデルに比べて6倍速い生成速度を実現し、画質も向上しています。また、API「BFL API」を公開し、開発者はこのAIをアプリケーションに統合可能です。今後は2K解像度での対応も予定されています。

ChatGPTで「ほんのちょっとした画像編集」を効率的に行う方法

ChatGPTを使うことで、画像のリサイズやファイル名の変更など、複数の作業を一度に簡単に行うことが可能です。従来はオンラインツールや専用ソフトが必要でしたが、ChatGPTなら指示を出すだけで複数の処理を同時に実行できます。例えば、画像のリサイズや解像度の変更、ファイル名の一括変更も1回の指示で完了。また、JPEGからPNGなどのフォーマット変換も可能で、ダウンロードリンクが生成されます。

Adobe、AI機能が使える「Photoshop Elements 2025」「Premiere Elements 2025」発表

Adobeは「Photoshop Elements 2025」と「Premiere Elements 2025」をリリースしました。AI削除ツールや焦点範囲フィルター、ホワイトバランスツールなどのAI機能が追加され、誰でも簡単に高度な画像・動画編集が可能です。さらに、Apple M3チップ対応によりMacでのパフォーマンスも向上しています。

OpenAIの「Sora」の共同リーダーがGoogle DeepMind入り

動画生成AIモデル「Sora」の共同リーダーを務めたティム・ブルックス氏が、Google DeepMindに移籍します。ブルックス氏は、ビデオ生成とworld simulatorsの開発に取り組む予定です。OpenAIは退社が相次いでおり、競合するGoogle DeepMindの「Veo」との競争が注目されています。

動画生成AI領域で新興スタートアップ続々、HedraやCaptionなどの動向

動画生成AI分野で、新興スタートアップ「Hedra」や「Captions」が注目されています。Hedraは、自然なリップシンクが可能なAIアバター「Hedra Character-1」で人気を集めており、ビデオ制作を自動化する統合ワークフローツールとしても注目されています。この分野では、OpenAIやGoogle DeepMindとの競争も激化しています。

【3】モバイル・マルチモーダルAI

Amazon「遅れ取り戻せ!」、数千人規模でAlexa改良

Amazonは、AI開発での遅れを取り戻すため、数千人の従業員を配置した新組織「汎用AIグループ」を立ち上げました。このグループは、ChatGPTの成功に刺激を受け、Alexaの改良に取り組んでいます。新しい大規模言語モデル「Titan」と「Olympus」の開発を進め、Alexaの機能向上を目指しています。

アップル新型iPhone SEとiPad、来年早期リリース準備-生成AI機能も

Appleは、低価格版「iPhone SE」と新型「iPad」を2025年初頭にリリースする準備を進めています。新しいiPhone SEは、iPhone 14に似たデザインで、Appleの生成AIプラットフォーム「Apple Intelligence」をサポートします。さらに、iPad Airの内部改善や新しい「Magic Keyboard」も予定されています。

ChatGPT無料版、人間みたいにしゃべる「高度な音声機能」使えるように

OpenAIは、ChatGPTの「高度な音声機能」を無料ユーザーにも段階的に提供すると発表しました。この機能は、抑揚をつけた自然な発話や、感情に配慮した返答が可能で、より人間らしい会話を実現します。もともと有料プラン向けの機能でしたが、無料ユーザーも一部利用可能になり、さらに広範なユーザーに展開される予定です。なお、利用には最新アプリが必要です。

会話型音声AIアシスタントのGemini Live、新たに40以上の言語をサポート

Googleは、音声AIアシスタント「Gemini Live」の対応言語を40以上に拡大すると発表しました。これまでは英語のみ対応していましたが、今後数週間で多言語対応が進む予定です。また、他のアプリやサービスとの連携機能も強化され、利便性が向上する見込みです。

【4】生成AI活用事例

生成AI、大学教員が知っておくべき10の活用法

生成AIの進化により、大学教育や研究活動においても活用が広がっています。例えば、ChatGPTを使ってレポートのフィードバックを得たり、自分専用の教材を作成することが可能です。しかし、不正利用のリスクもあるため、教育者はその可能性を理解し、適切に管理する必要があります。生成AIは、学習促進にも役立つツールとして、活用法を工夫することが重要です。

桂文枝、AI創作落語を披露 生成AIを弟子に上質な落語を完成「面白いものができる」

落語家の桂文枝が、Googleの生成AI「Gemini」と協力して創作落語を披露しました。イベントでは、文枝が「桂文Gemi」と名付けたAIとのやり取りを通じて約1か月半で完成させた作品を発表。AIを弟子に見立て、ユーモアを学ばせた結果、質の高い落語が完成し、会場を大いに盛り上げました。

フォルクスワーゲンがGoogleとタッグ 生成AI「Gemini」搭載で、何ができる?

VolkswagenはGoogleと提携し、同社の専用アプリ「myVW」に生成AI「Gemini」を導入しました。このバーチャルアシスタント機能により、車両情報やサービスに簡単にアクセスでき、タイヤ交換やインジケーターライトの説明など、車両関連の質問に対応。アプリのマルチモーダル機能を使えば、スマホカメラでダッシュボードを撮影するだけで詳細情報を取得できます。

生成AIの回答を洗練させる「プロンプトエンジニアリング」ツール7選

生成AIが正確な回答をするためには「プロンプトエンジニアリング」が重要です。これはAIに対して適切な指示を与える技術であり、これを効率化するための7つのツールが紹介されています。各ツールはプロンプトの設計をサポートし、生成AIの活用プロジェクトを成功に導くために役立ちます。

「生成AIは面白い」日本マイクロソフト津坂美樹の対話術

日本マイクロソフト社長の津坂美樹氏は、生成AIを活用した業務効率化や対話術を実践しています。特に「Copilot」を活用し、業務の自動化や考えを深掘りするためのツールとしてAIをフル活用。津坂氏は、生成AIの可能性を「面白い」と感じ、業務やリサーチにおける活用方法を探求し続けています。

【5】生成AI業界

ChatGPT生みの親、サム・アルトマンが予言した「超知性」で激変する生成AIの未来図

OpenAIのサム・アルトマンCEOは、今後数千日以内に人類よりも賢い「超知性」が誕生すると予測しました。生成AI技術は急速に進化しており、ビジネスや日常生活のあらゆる分野に影響を与えています。特に市場規模は2027年までに1200億ドルに達すると予測され、AI技術の活用がビジネスパーソンにとって重要なスキルとなるでしょう。

ChatGPTのo1は「ノーベル賞ものだと思う」──孫正義氏による“成年の主張”

ソフトバンクグループの孫正義氏は「SoftBank World 2024」の基調講演で、OpenAIの新しい大規模言語モデル「o1」について「ノーベル賞ものだ」と絶賛しました。o1は、物理学や数学などの分野で博士課程レベルの能力を発揮し、他のAIと比べて「考える」深さがあると評価されました。孫氏は、AI技術の進化が「知のゴールドラッシュ」を引き起こし、今後数年で「パーソナルエージェント」が普及すると予測。個々のユーザーに最適化されたAIが健康管理や投資、教育などの分野で活躍する未来を描きました。

ChatGPT手がけるオープンAI 開発に向けた投資 加速へ アメリカ

OpenAIは、日本やアメリカの金融機関から最大40億ドル(約5900億円)の借り入れ枠を確保したと発表しました。また、66億ドル(約9700億円)の資金調達も行い、AI開発への投資をさらに加速させる計画です。OpenAIは、競争が激化する生成AI市場において、巨額の資金を投入し続ける必要があり、マイクロソフトやソフトバンクグループなども資金調達先に含まれています。

米オープンAIに6000億円 日米欧9行が融資枠、三井住友銀やJPモルガンなど

OpenAIは、三井住友銀行やJPモルガン・チェースなどの日米欧の9行から、約6000億円の融資枠を確保しました。この資金はAI開発の強化に使用されます。2日には66億ドルの資金調達も完了しており、AI開発加速のために1兆5000億円以上の資金を確保しています。

オープンAI、音声サービス構築迅速化で新技術 開発者に提供開始

OpenAIは、音声対応AIサービスを簡単に構築できる新たなツール群を発表しました。このツールにより、従来複数のプロセスが必要だった音声サービス開発が一本化され、リアルタイムの反応が可能に。開発者向けに試験提供が開始され、音声サービスの構築が効率化されます。

孫氏、オープンAIの新モデル絶賛も出資については言及せず

ソフトバンクグループの孫正義氏は、OpenAIの新モデル「o1」を「ノーベル賞もの」と称賛しました。孫氏はAIが今後、人間と精神的な関係性を持つ「人工知性」へと進化し、超知性時代が到来すると予測。一方で、OpenAIへの5億ドルの出資に関しては詳細を語りませんでした。

OpenAI、9600億円調達 NVIDIAやソフトバンクグループが投資

OpenAIは66億ドル(約9600億円)の資金を調達し、企業価値は1570億ドルに達しました。この資金はNVIDIAやソフトバンクグループを含む幅広い投資家からのもので、AI開発に必要な巨額の資金を確保しています。今回の調達は未上場企業として過去最大級の規模です。

サム・アルトマンさん、AIで気候問題は「解決」できません

OpenAIのサム・アルトマンCEOは、AIが気候変動問題を解決すると主張していますが、AIの開発と運用には大量の電力が必要であり、温室効果ガスの排出を増加させています。AI技術が問題を解決する一方で、その環境負荷にも目を向ける必要があるという指摘がされています。

エヌビディア、アクセンチュアと提携強化 企業のAI利用拡大に向け

エヌビディアは、アクセンチュアとの提携を拡大し、企業内でのAI普及を推進する取り組みを発表しました。アクセンチュアはエヌビディア技術に特化した専門家を育成し、AIツールの導入を支援します。また、エヌビディアの次世代半導体「ブラックウェル」もフル生産に入っており、同製品の需要が高まっています。

【6】SNS業界

YouTube、「誤ったスパム判定でBANされた」の報告が相次ぐ。公式は「復元する」と説明

YouTubeで誤ったスパム判定によるアカウントBANが相次ぎ、プレイリストが消える事例も発生しています。YouTube公式はこの問題を認識し、チャンネルやコンテンツの復元を進めていると発表しました。再審査の申請が推奨されていますが、プレイリストの復元には時間がかかる可能性があります。

YouTube ショート、動画の長さを1分から3分まで拡張

YouTubeは10月15日から、ショート動画の長さを1分から3分に拡張します。この変更はクリエイターの要望を受けたもので、正方形や縦長の動画が対象です。また、ショート動画の作成を簡単にする「テンプレート」機能や、お気に入りのコンテンツをリミックスできる新機能も追加予定です。

【7】おすすめ動画

生成AI「速さから深さに」 ソフトバンクGの孫氏が講演

ソフトバンクグループの孫正義会長兼社長が、生成AIについて「速さではなく、深さを自慢するステージに来た」と述べ、AIの進化とその企業・社会での活用についての見通しを語りました。特に、AIが企業の課題解決に貢献する未来を強調し、今後のAIの役割が単なる情報の速さから、より深い知識に基づく解決策の提供に変わっていくと説明しています。

【ChatGPT】人間並みの応答速度に進化!感情豊かな新音声機能でAI漫才も【チャエン&神庭亮介&柴田阿弥が徹底検証】

新しく登場したChatGPTの音声会話機能「アドバンスドボイス」は、従来のものより応答速度が劇的に向上し、ほぼ人間と同じ速度で会話できるようになりました。実際の使用例として、関西弁でのAI漫才を披露し、非常に自然な会話を実現。企業や日常生活でも多くの場面での活用が期待され、特にコールセンターや通訳などの業務にも適しているとのことです。


公式LINE登録で特典がもらえます


AIのある暮らし公式LINEに登録いただくと「AIの最新情報」「勉強会の募集」の案内や「本当にしごとに役立つプロンプト20選」ががもらえます。

さいごに

ここまでお読みいただきありがとうございました。

また今後もしごとや暮らしに役立つAI情報を発信していく予定ですので、アカウントのフォローをお願いいたします。

それではまた次の投稿でお会いしましょう!


この記事が気に入ったらサポートをしてみませんか?