【忙しい人のために】生成AI関連のニュースまとめました | 2024年10月

灰藤健吾 │生成AIアドバイザー

2024年11月4日 16:10

【告知】実践的な生成AI活用セミナーを開催します！

生成AIの現場活用において「AI×経理」という、新しい視点でのセミナーを開催します！

経理責任者６年の経験を活かして、実際に経理・会計に役立つ生成AI活用を、実践を交えてお伝えするセミナーです

経理だけでなく、バックオフィス全般に活用できる方法にもなりますので、ぜひご参加ください

OpenAI、ChatGPT関係

OpenAI⁠⁠、ChatGPTの新機能「canvas」をリリース。執筆やコーディング作業を支援

https://aismiley.co.jp/ai_news/openai-canvas-chatgpt/

OpenAIはChatGPTに新機能「canvas」を導入しました。この機能は、執筆やコーディングをChatGPTと共同で行うためのツールで、特定の文章の編集やコードレビュー、バグ修正を効率的にサポートします。「canvas」はGPT-4oモデルを基盤としており、ユーザーの作業をリアルタイムでサポートし、プロジェクト全体のスムーズな進行を可能にします。今後もユーザーフィードバックを元に改良が進められる予定です。

【OpenAI公式】ChatGPTのプロンプトジェネレーターで自動生成！始め方や使い方と料金

https://miralab.co.jp/media/chatgpt_prompt_generator/

OpenAIが提供するChatGPTプロンプトジェネレーターは、AIとの対話に最適なプロンプトを自動生成するツールです。このツールを使えば、特定のテーマでの質問作成や会話の流れを簡単に構築でき、ChatGPTの性能を引き出すことができます。利用は有料で、トークンベースの料金体系を採用しています。操作はシンプルで、Playgroundを通じてプロンプトを生成し、テストできます。

「ChatGPT」、「Windows」版アプリがようやく登場--まずは有料ユーザーから

https://japan.zdnet.com/article/35225128/

OpenAIが「ChatGPT」のWindows版アプリの初期バージョンを公開しました。このアプリはChatGPT Plusなどの有料ユーザーが対象で、ショートカット機能やコンテキスト認識機能を備えています。Windows版アプリは、PCでのChatGPTの利用をさらにスムーズにし、作業効率を向上させます。2024年中にはすべてのユーザーが利用可能になる予定です。

【Realtime API】OpenAIが音声会話可能なモデルのAPIを公開！音声サービスの開発が簡単に

https://weel.co.jp/media/innovator/realtime-api/

OpenAIは2024年10月1日にRealtime APIを発表しました。このAPIは、リアルタイムの音声対話をアプリケーションに統合できるもので、特に言語学習アプリやカスタマーサポートなどでの活用が期待されています。音声とテキストの両方の入力を処理し、より自然な会話体験を提供します。料金は利用するトークン数に基づき、音声ベースの応答が迅速かつスムーズに行える仕組みです。

OpenAI unveils experimental 'Swarm' framework, igniting debate on AI-driven automation

https://venturebeat.com/ai/openai-unveils-experimental-swarm-framework-igniting-debate-on-ai-driven-automation/

OpenAIは、AIエージェントのネットワークを統括するための実験的なフレームワーク「Swarm」を発表しました。この技術は複雑なタスクを自律的に処理できる多エージェントシステムの開発を支援し、企業の自動化に新たな可能性をもたらします。一方で、AIの倫理、セキュリティ、雇用への影響に関する議論を巻き起こしています。Swarmはまだ公式製品ではありませんが、将来のAIシステムの設計において重要な役割を果たすと期待されています。

faster-whisperでWhisper Turboとlarge-v3の速度と精度を比較

https://note.com/shinao39/n/n291fa495e9b5

OpenAIがリリースした「Whisper large-v3-turbo」は、従来のモデルよりも精度をわずかに下げつつ、高速化を実現した音声認識モデルです。日本語の音声認識では、前のバージョンよりわずかに良い精度を持ち、十分実用的です。実際に試した結果、一般的な会話やポッドキャストの文字起こしにおいて問題なく機能しました。一方、細かい表現や「まあ」「でも」といった音声が時折無視されることもあります。

OpenAI幹部がChatGPTの収益を語る、週間アクティブユーザーは2億5000万人で収益の75％は一般有料ユーザー

https://gigazine.net/news/20241030-openai-chatgpt-revenue-consumers/

OpenAIのCFOサラ・フライヤー氏は、ChatGPTの収益の大部分が一般有料ユーザーからもたらされていると明かしました。週間アクティブユーザーは2億5000万人に達し、有料ユーザーへの移行率は5～6％です。2024年の年間売上高は37億ドルと予想されていますが、高度なAIシステムの開発には多額のコストがかかり、50億ドルの損失が見込まれています。

OpenAI, Microsoft in $14B tussle over equity rights in AI giant: report

https://nypost.com/2024/10/18/business/openai-microsoft-in-14b-tussle-over-equity-rights-in-ai-giant-report/

OpenAIが非営利から営利企業への移行を計画する中、MicrosoftとOpenAIは14億ドルの投資に対する持分比率を巡って交渉を行っています。MicrosoftはOpenAIへの巨額投資に見合った持分を求めており、両社は今後の企業統治権についても調整中です。この動きは、AI業界における資金調達と企業価値に新たな焦点を当てています。

OpenAIが1兆円調達　生成AI「勝者総取り」の規模追求へ

https://www.nikkei.com/article/DGXZQOGN02EAY0S4A001C2000000/

OpenAIは約1兆円の資金調達を発表し、非営利組織から営利企業への転換を進める見通しです。生成AIの開発競争は、資金とデータを大量に保有する企業が優位に立つ「勝者総取り」の構図が鮮明になっています。この資金調達により、OpenAIはさらにその規模を追求し、AI分野でのリーダーシップを強化することを目指します。

ソフトバンクがOpenAIに720億円を投資か？AI業界に大きな変化が迫る

https://www.multifverse.com/blog-posts/softbank-openai-5-billion-investment

ソフトバンクのビジョンファンドがOpenAIに5億ドル（約720億円）の投資を予定しているとの報道がありました。この投資によりOpenAIの企業価値は1,500億ドル（約21兆円）に達すると見込まれ、AI業界における商業化と成長をさらに加速させる狙いです。この資金調達にはMicrosoftも参加し、AI技術の商業化に向けた新たな時代を切り開く動きが期待されています。

OpenAIの共同創業者がまた1人、Anthropic入り

https://www.itmedia.co.jp/news/articles/2410/02/news104.html

OpenAIの共同創業者であるダルク・キングマ氏がAnthropicに入社しました。キングマ氏は、OpenAIの創設メンバーであり、アルゴリズムチームのリーダーとして基礎研究を担当。その後、Google DeepMindに移り生成モデルの研究を行いました。Anthropicには、元OpenAIの他の重要メンバーも加わっており、今後のAI開発に向けた協力が期待されています。

元OpenAI社員の告発｢OpenAIは著作権法をやぶりまくっている｣

https://www.gizmodo.jp/2024/10/295821.html

元OpenAI研究員のSuchir Balaji氏が、OpenAIがアメリカの著作権法を遵守していないと告発しました。Balaji氏は、AIモデルのトレーニングデータに著作権で保護された情報が含まれており、「フェアユース」の基準を満たしていないと主張しています。この問題により、OpenAIはニューヨーク・タイムズをはじめとする多数の個人や企業から提訴されています。OpenAIは合法的にデータを使用していると反論しています。

その他生成AIサービス

Anthropic、「Claude 3.5 Sonnet」更新と「Claude Haiku 3.5」リリースを発表

https://www.itmedia.co.jp/news/articles/2410/23/news104.html

Anthropicは、言語モデル「Claude 3.5 Sonnet」と「Claude Haiku 3.5」のアップデートを発表しました。Sonnetはプロンプト入力でPC操作を可能にする機能が追加され、Haikuは高速性と低コストを特徴に、様々な能力が向上しました。これらのモデルはAmazon BedrockやGoogle Cloudでも利用可能になり、効率的なAI活用を促進します。

900行のコードをノーミスで出力するClaude 3.5 Sonnet (New) やるなお主

https://note.com/norito_hiraoka/n/n0ce1db17c8a1

この記事では、Anthropicの言語モデル「Claude 3.5 Sonnet (New)」のコード生成能力が紹介されています。特に、900行のPythonコードをほぼノーミスで生成した点が強調されています。以前のモデルと比較して、コード補完から複雑なプログラムの作成まで大幅に改善されており、就活支援ツールの開発にも応用されています。

【働き方に革命】AIがパソコンを支配する。驚きのClaude最新アップデート「Computer User demo」を徹底解説。

https://ai-database.beehiiv.com/p/ai-claude-computer-user-demo

Anthropicが「Claude 3.5 Sonnet」と「Claude 3.5 Haiku」をアップデートし、新機能「Computer Use」を発表しました。この機能によりAIがマウスやキーボードを自動で操作し、コード生成からファイル操作、バグ修正などのPC操作を自動化できます。この革新により、単純作業の自動化が進み、効率的な業務遂行が可能となります。

Claudeで3000行のCSVファイルをリアルタイムにグラフ化し分析する | DevelopersIO

https://dev.classmethod.jp/articles/claude-data-analytics/

Claudeの最新アップデートにより、CSVファイルをリアルタイムでグラフ化し、JavaScriptを使用して動的なデータ分析が可能になりました。ユーザーは気象データなどの大規模なデータセットを用いて、視覚的にわかりやすいグラフを生成し、分析結果を即座に確認できます。この新機能により、BIツールとしての可能性が拡大し、より直感的なデータ操作が実現されています。

Updated production-ready Gemini models, reduced 1.5 Pro pricing, increased rate limits, and more

https://developers.googleblog.com/en/updated-gemini-models-reduced-15-pro-pricing-increased-rate-limits-and-more/

Googleは、Gemini 1.5 ProとFlashモデルの新バージョンをリリースしました。これらのモデルは価格を大幅に引き下げ、速度を2倍に、レイテンシーを3分の1に削減しました。また、プロンプトごとのトークン制限が緩和され、より柔軟な開発が可能になっています。特に、数千ページのPDFや長時間の動画を処理する能力が向上し、幅広いテキストやマルチモーダルタスクに対応可能です。

Google updates: AI-Organized Search, Google Lens, and more

https://blog.google/products/search/google-search-lens-october-2024-updates/

Googleは、AIを活用した検索機能の大幅なアップデートを発表しました。新機能では、動画や音声を使った検索が可能になり、Google Lensを通じて写真や動画内のオブジェクトについて質問できます。また、見たものをその場で購入できるショッピング機能が強化され、楽曲を瞬時に特定する「Circle to Search」がさらに多くのデバイスで利用可能に。これらのアップデートにより、検索体験がよりインタラクティブで包括的になりました。

グーグルの「NotebookLM」を使ったAIポッドキャストが注目されている

https://wired.jp/article/ai-podcast-google-notebooklm/

Googleの文書作成ツール「NotebookLM」が生成するAIポッドキャストが話題となっています。このツールはアップロードされた文書を要約し、音声で自然に会話するポッドキャストを生成します。特に「Audio Overview」機能が注目され、ユーザーは複雑な情報を短時間で理解できる音声コンテンツを簡単に作成できます。これにより、新しい形式の情報提供が可能となり、ユーザーの想像力をかき立てています。

急成長するGoogleのAIノート「NotebookLM」、実験から格上げ、企業利用も加速

https://news.mynavi.jp/article/20241018-3046989/

GoogleはAIノート「NotebookLM」を正式版へ格上げし、企業向けの「NotebookLM Business」を発表しました。このツールは、アップロードされた文書やデータをAIが解析し、要点をまとめることが可能です。新たに追加された「Audio Overview」機能では、ポッドキャスト形式で情報を音声で要約し、ユーザーがガイド可能なカスタマイズ機能も加わりました。この機能により、特定のトピックやユーザー層に合わせた情報提供が可能です。

Gemini に新しい機能が追加：Imagen 3 による画像生成とカスタム Gem

https://blog.google/intl/ja-jp/company-news/technology/gemini-imagen-3-gem/

GoogleはGeminiに新機能を追加し、画像生成モデル「Imagen 3」を活用した高品質な画像生成が日本語にも対応しました。また、カスタムAIエキスパートを作成できる「Gem」機能も導入。ユーザーは自身の目的に応じたカスタムAIを利用し、コーディングやキャリアアドバイスなど幅広い支援を受けられるようになりました。これにより、より効率的でパーソナライズされたサポートが可能になります。

Google Workspace、生成AIアシスタント機能が日本語に対応　GmailやGoogle ドライブ内の資料要約などが可能に

https://www.itmedia.co.jp/aiplus/articles/2410/17/news176.html

Google日本法人は、Google Workspace内で利用可能な生成AIアシスタント「Gemini for Google Workspace」のサイドパネル機能が日本語を含む7言語に対応したと発表しました。この機能により、GmailやGoogleドライブ内の資料の要約、分析、コンテンツ生成が可能になり、アプリやタブを切り替える必要がなく、作業効率が向上します。

【速報】Gemini サイドパネルが日本語対応開始！Workspace での AI 活用が加速

https://www.yoshidumi.co.jp/collaboration-lab/gemini-side-panel-now-available-in-japanese

Google WorkspaceのAIアシスタント「Gemini」のサイドパネルが日本語対応を開始しました。これにより、Google ドキュメント、スプレッドシート、Gmail、Google ドライブ上でタブを切り替えることなく、直接Geminiと対話し、作業中のコンテンツをリアルタイムで要約、翻訳、分析が可能となります。この機能により、業務効率が大幅に向上し、生産性の高い作業が期待されます。

すべての人に AI アシスタントを - News Center Japan

https://news.microsoft.com/ja-jp/2024/10/02/241002-an-ai-companion-for-everyone/

MicrosoftはAIアシスタント「Copilot」を発表しました。このアシスタントは、ユーザーの言葉を理解し、生活の中で役立つ情報を提供します。プライバシーやセキュリティを保護しながら、ユーザーのニーズに応じて進化し、日常生活や仕事の支援を強化。特に、個人化されたサポートや、重要なタスクの効率化を目指しています。

Copilotが危ない？　生成AIから「認証情報が盗まれる」手口が明らかに

https://techtarget.itmedia.co.jp/tt/news/2410/17/news05.html

生成AIツール「Microsoft Copilot」がプロンプトインジェクション攻撃の脅威にさらされています。攻撃者は不正なプロンプトを使用してユーザーをだまし、認証情報を盗む手口を使います。この攻撃は、Copilotの操作権限を悪用してフィッシング詐欺を行うものです。対策として、セキュリティベンダーZenityは防御策を検討するためのツール「LOLCopilot」を開発しました。

Apple、新型iMacに半導体｢M4｣搭載　生成AI機能「Apple Intelligence」に対応

https://www.nikkei.com/article/DGXZQOGN2903E0Z21C24A0000000/

Appleは11月8日に新型iMacを発売し、最新半導体「M4」を搭載することを発表しました。このモデルは生成AI機能「Apple Intelligence」に対応し、高い処理性能を備えています。M4はAppleが自社設計したもので、AI処理速度が大幅に向上。新型iMacは、AI機能を活用したより効率的なユーザー体験を提供します。

Apple、新型「Mac mini」11月8日発売　M4・M4 Pro搭載で9万円台から

https://www.nikkei.com/article/DGXZQOGN29DVP0Z21C24A0000000/

Appleは新型「Mac mini」を11月8日に発売します。このモデルには最新の半導体「M4」および「M4 Pro」が搭載されており、価格は9万円台からです。新型Mac miniは、Appleの生成AIサービス「Apple Intelligence」に対応しており、処理性能が向上しています。小型ながらも強力なパフォーマンスを提供し、ユーザーの利便性を高めます。

メタ、新たなAIモデル「Movie Gen」を発表。動画生成のフロンティアに参入

https://wired.jp/article/meta-movie-gen-ai-model/

Metaは動画生成AIモデル「Movie Gen」を発表しました。このモデルはテキストからリアルな動画を生成するほか、既存の動画クリップへの編集や音声生成も可能です。Metaは10秒間の高解像度動画を生成する能力を示し、音声クリップも提供することで、動画制作の新しい可能性を拓いています。リリース時期は未定ですが、将来的にソーシャルメディアプラットフォームでの利用が期待されています。

Metaがモバイルデバイスで実行できる軽量な量子化Llamaモデルをリリース

https://gigazine.net/news/20241025-meta-llama-quantized-lightweight/

MetaはLlama 3.2の軽量な量子化モデルを発表しました。このモデルは、精度をほぼ維持しつつ推論速度を大幅に向上させる技術「QLoRA」を採用しています。1Bモデルと3Bモデルで、メモリ使用量が最大45％削減され、トークン生成速度が約2.4倍に改善されました。これにより、モバイルデバイスでも効率的なAI推論が可能となります。

アドビの「PDF向け生成AI」が2025年初頭に日本語対応へ…生成AIでPDFの用途を拡大

https://news.yahoo.co.jp/articles/9cfce6926d6599c6cfcff20472cd3b1edc28a380

Adobeは「Adobe Acrobat」に搭載される生成AI機能「Acrobat AI Assistant」が2025年初頭に日本語対応を開始します。この機能はPDFファイルの要約やチャット形式での質問応答を可能にし、最大600ページのPDFを処理できます。日本語対応によって、国内の法務や人事などの業種で効率的な文書管理が期待されています。

Gensparkがパートナーデータソース統合とAutopilot Agentのアップグレードを発表

https://x.com/genspark_ai/status/1841645428166774869

Gensparkは、パートナーデータソースの統合とAutopilot Agentのアップグレードを発表しました。これにより、ユーザーは研究や業務のための高品質な情報をよりスムーズに利用できるようになります。新機能はSparkpageを通じて提供され、作業フローの効率化が期待されています。

AI検索の「Perplexity」、公開情報と社内のナレッジを統合する新機能

https://www.watch.impress.co.jp/docs/news/1632858.html

Perplexityは新たに「内部ナレッジ検索」と「Spaces」を発表しました。内部ナレッジ検索は、Webと社内データを統合して検索できる機能で、情報への迅速なアクセスを可能にします。一方、「Spaces」はプロジェクトメンバーが共同作業できるハブ機能で、社内ファイルへのアクセスやAIアシスタントを活用した調査を効率化します。この新機能は、業務効率や情報の信頼性を向上させます。

【遂にリリース】Perplexityが推論特化検索を提供開始！スモールビジネスにどのように役立つか

https://ai-wave.jp/2024/10/25/perplexity-ai-inference-search/

Perplexityが推論特化の検索機能をリリースし、スモールビジネスの効率的な情報収集と意思決定を支援します。この新機能は、複数の情報源を基に最適な提案を生成し、経営者の戦略立案を支援。また、内部ナレッジ検索と「Spaces」機能により、チーム内の情報共有と協力が強化され、ビジネスの生産性向上に寄与します。

Feloの新機能「深度検索」完全ガイド：効果的な活用方法とおすすめプロンプト50選

https://ai-gallery.jp/felo-deep-search-perfect-guide/

日本発のAI検索エンジンFeloが「深度検索」機能を公開しました。この機能は、ユーザーの検索意図を深く推測し、関連性の高い情報を迅速に提供します。特に複雑な質問にも素早く対応し、多くの情報源を網羅するため、業務効率を大幅に向上させることが可能です。無料プランでも利用可能で、効率的な情報収集に役立ちます。

Announcing FLUX1.1 [pro] and the BFL API

https://blackforestlabs.ai/announcing-flux-1-1-pro-and-the-bfl-api/

Black Forest Labsが新しい生成モデル「FLUX1.1 [pro]」と「BFL API」をリリースしました。FLUX1.1 [pro]は、従来のモデルに比べて生成速度が6倍速く、画質や多様性も向上しています。BFL APIは、開発者や企業が高品質な画像生成技術を容易に統合できるよう設計されており、柔軟なカスタマイズやスケーラビリティが特徴です。

Send Your Interactive Avatar to Zoom Meetings

https://www.heygen.com/article/send-your-interactive-avatar-to-zoom-meetings

HeyGenのインタラクティブアバターがZoomミーティングに参加できるようになりました。このアバターは外見や声だけでなく、リアルタイムで思考し、会話や意思決定も可能です。24/7稼働するこのアバターは、カスタマーサポートや営業、コーチングなど、繰り返しの会議に最適で、ユーザーが重要な業務に集中できる環境を提供します。

【衝撃】AIアバターとリアルタイム会話！HeyGenの進化がヤバすぎる！

https://www.youtube.com/watch?v=jvlyfEFNxUA

動画ではHeyGenの最新AI技術が紹介されています。AIアバター「桜木美佳」とのリアルタイム対話を通じて、同時通訳、多言語対応、RAG学習機能などがデモンストレーションされます。営業やカスタマーサポートなど、様々なビジネスシーンでの活用可能性が示され、AI技術の未来を垣間見ることができます。

【Hailuo AI】無料で使えるのにハイクオリティーな動画生成AI

https://ground-cd.com/blog/hailuo-ai/

Hailuo AIは、中国のAI企業MiniMaxが開発した無料の動画生成ツールです。テキストからの動画生成に加え、新たに静止画から動画を生成する機能も追加されました。このAIは短時間で自然な動きの高品質な動画を作成可能で、SNSを中心に注目されています。簡単な操作で動画が作成できるため、多くのユーザーに利用されています。

AI生成キャラクターをリアルな表情でアニメーションさせられるツール「Act-One」をRunwayがリリース

https://gigazine.net/news/20241023-runway-act-one/

Runwayは、AIツール「Act-One」をリリースしました。このツールはスマートフォンのカメラで撮影した映像をもとに、AIが生成したキャラクターにリアルな表情を転送することができます。従来のモーションキャプチャーが不要で、さまざまなキャラクターデザインに対応可能。Act-Oneは小規模クリエイターでもシネマティックな品質の動画を作成できる革新的なツールです。

Suno AIのiPhoneアプリ、日本のApp Storeに登場。「スノー - AI音楽」で写真やビデオをその場で音楽に

https://www.techno-edge.net/article/2024/10/28/3789.html

Suno AIのiPhoneアプリ「スノー - AI音楽」が日本のApp Storeで提供開始されました。このアプリは写真やビデオを取り込んでその場で音楽やミュージックビデオを生成する機能を搭載しています。また、iPhoneのマイクから直接オーディオを録音し、それを元に歌を作ることも可能です。従来のブラウザ版とは異なるUIで、直感的な操作が特徴です。

画像生成AIの中でガチリアルといわれるRecraft V3とは？使い方を解説

https://ai-workstyle.com/ai-recraft-v3/

Recraft V3は、HuggingFaceのベンチマークで1位を獲得した革新的な画像生成AIです。長文テキスト生成や正確な解剖学的表現、自由なデザイン制御機能を備え、プロフェッショナルなデザインワークに対応します。無料プランから有料プランまで幅広いニーズに対応し、商用利用も可能です。従来の画像生成AIを超える性能で、クリエイティブ業界に新たな可能性を提供します。

キャラクターにダンスさせられる「Animate-X」が登場！

https://x.com/hirochuu8/status/1846574417037742080

新しいアニメーションツール「Animate-X」が発表されました。このツールは、キャラクターを自動的にダンスさせる機能を提供し、従来の棒人間ベースのアニメーションとは異なり、様々な形状のキャラクターにも対応します。これにより、キャラクターごとの個別調整が不要になり、アニメーション作成がより効率的に行えます。

AIを活用したUI作成ツール「v0」の新プランが登場！スモールビジネスに最適な理由とは？

https://ai-wave.jp/2024/10/16/ai-powered-ui-tool-v0-new-plans/

Vercelの新しいUI生成ツール「v0」が、スモールビジネス向けに注目されています。AIを活用し、ReactやTailwind CSSを基にしたプロフェッショナルなUIを自動生成するこのツールは、ウェブデザインの専門知識が不要です。迅速なプロトタイピングやコスト管理の容易さが特徴で、PremiumおよびEnterpriseプランも提供され、ビジネスの成長に合わせた柔軟な運用が可能です。

わずか10秒の元音声でもリアルな「なりきりボイチェン」できる無料ソフト『Seed-VC』は過去最高レベルの再現度か

https://www.techno-edge.net/article/2024/10/17/3768.html

オープンソースの音声変換ソフト「Seed-VC」は、10秒程度の短い元音声から高品質なボイスチェンジが可能です。ゼロショットでの音声変換が特徴で、従来の手法よりも迅速かつ簡便に、元の声に近い変換を実現します。歌声や話し声など多様な音声に対応し、リアルタイム性も向上しています。

【音声クローン作成】たった2秒の音声からAI音声合成！E2-F5-TTSで自分の声をクローン化する方法

https://note.com/ai_hakase/n/n767be7104579

E2-F5-TTSは、わずか2秒の音声データから自分の声を高品質でクローン化できる技術です。少量のデータで自然な音声合成を実現し、多言語対応も可能。特に、Non-Autoregressive TTS技術により高速な処理が可能で、従来の方法に比べて手軽に音声クローンを作成できます。用途に応じてE2とF5の2つのモデルがあり、速度重視ならE2、高品質重視ならF5が推奨されています。

【ElevenLabs】超ハイレベルなオーディオ生成AIが登場！使い方を徹底解説

https://weel.co.jp/media/innovator/elevenlabs/

ElevenLabsは、人間のような自然な音声を生成するAIプラットフォームです。多言語対応で、日本語を含む32ヶ国語に対応。音声生成の速度やノイズ除去の精度が高く、イントネーションや抑揚も自動調整可能です。また、API経由での利用も可能で、様々な業務効率化に役立ちます。無料プランから試用でき、商用利用もサポートされています。

生成AI活用事例

ハローワーク、生成AI導入を検討　マッチングの効率化狙う　OpenAI Japanの協力も視野に

https://www.itmedia.co.jp/aiplus/articles/2410/01/news096.html

厚生労働省は、ハローワークの求人マッチング効率化を目指し、生成AIの導入を検討しています。このAIは求職者と求人者の問い合わせに対応し、必要なサービスを案内する役割を担います。一方で、プライバシー侵害やバイアスリスクといった課題も指摘されています。プロジェクトには、OpenAI Japanの専門家の協力も視野に入れています。

桂文枝、生成AIと共作で“創作落語”　手応え十分「落語というのは“心”です」

https://www.oricon.co.jp/news/2335998/full/

落語家の桂文枝氏がGoogleの生成AI「Gemini」と共に創作落語を披露しました。文枝氏が監修し、Geminiが台本を担当。1ヶ月半の準備を経て、イベントで披露されました。対談では、文枝氏がAIの可能性を認めつつも、落語の「心」を伝える難しさを語りました。Googleのスンダー・ピチャイCEOとの対話も行われ、AIと人間の協力の可能性が示されました。

JR東が「鉄道版生成 AI」開発へ　鉄道固有の知識を学習、経験浅い社員の知識レベル底上げに

https://www.itmedia.co.jp/aiplus/articles/2410/08/news148.html

JR東日本は、鉄道業務の効率化を目的に「鉄道版生成 AI」を開発すると発表しました。このAIは、鉄道に関する法令や規則、属人化した業務ノウハウを学習し、新入社員や経験の浅い社員の知識レベルを引き上げます。具体的には、顧客対応の迅速化や安全性向上、部門間調整の効率化などを目指しています。完成は2027年度末を予定しています。

Uber gives users option to only hail full-electric vehicles, launches AI chatbot

https://www.cnbc.com/2024/10/08/uber-offers-option-of-only-full-electric-vehicles-launches-ai-chatbot.html

Uberは、新たな環境対策として、電気自動車（EV）のみを選択できるオプションを導入しました。さらに、EV購入や使用についての質問に答えるAIチャットボットを提供開始します。この取り組みは、2040年までにゼロエミッションプラットフォームを目指す一環であり、EV普及と持続可能な交通手段の推進を狙っています。

東京メトロ、生成AIで問い合わせ対応　「100％の性能でなくても実用化」を決断できたワケ

https://www.itmedia.co.jp/business/articles/2410/11/news064.html

東京メトロは、生成AIを活用して問い合わせ対応を効率化する新システムを導入しました。特に忘れ物対応に重点を置き、チャットボットで定型的な質問を自動処理することで、オペレーターの負担を軽減。これにより、顧客体験の向上と業務効率化を目指しています。AIの完全な性能ではなくても、実用性を優先した決断が注目されています。

顔写真を「ONE PIECE」風に変換する「似顔絵メーカー」　尾田栄一郎氏「エロい写真も？聞いてみました」

https://ascii.jp/elem/000/004/227/4227829/

バンダイナムコエンターテインメントが「ONE PIECE BASE」という新アプリをリリースしました。このアプリには、ユーザーの顔写真を「ONE PIECE」風の似顔絵に変換し、オリジナルの手配書を作成できる機能が搭載されています。原作者の尾田栄一郎氏もコメントを寄せ、ユーモアを交えた紹介が話題です。また、ログインキャンペーンなども展開されています。

キリン、新卒採用に“AI面接官”を試験導入　生成AI利用で「人間の約6倍多角的に評価できる」

https://www.itmedia.co.jp/aiplus/articles/2410/16/news176.html

キリンホールディングスは、新卒採用に「AI面接官」を試験導入します。AIは社会人基礎力に基づく30項目を評価し、これまでの人間の評価範囲を大幅に超える多角的な分析が可能です。候補者の回答を深堀りし、面接体験を向上させるとともに、企業の採用業務の効率化も図ります。

“AIピザ”爆誕　ピザハット、AI活用で全ピザのチーズ量を130％に増量へ　生成AIでWebCMも作成

https://www.itmedia.co.jp/aiplus/articles/2410/17/news160.html
日本ピザハットは、AIを活用し全ピザのチーズ量を130％に増量することを発表。AI味覚センサーレオを用い、最適なチーズ量を分析。価格変更なしで新しいピザを全国で販売します。

【10・21】ＡＩピザ【爆誕】 - YouTube

https://www.youtube.com/watch?v=yzSc9WXYFgQ
AIと人間の共同研究により、ピザのチーズ量を130％に増量するのが「うまさの黄金比」と判明。AI生成動画がその過程を紹介しています。

富士通、生成AIでシステム更新時間半減　トヨタ系と実証

https://www.nikkei.com/article/DGXZQOUC246XB0U4A021C2000000/
富士通は、生成AIを使いシステム更新作業を半減。トヨタシステムズとの実証実験に成功し、2025年度中の商用化を目指します。

正念場のG7「AI監視網」　日米と欧州、すれ違う思惑

https://www.nikkei.com/article/DGXZQOUA181V50Y4A011C2000000/
G7デジタル・技術相会合で生成AI監視枠組みの合意が持ち越されました。日米と欧州間のAI規制に関する意見の違いが原因です。

ノーコード＆AIカオスマップ更新【2024年10月版】

https://prtimes.jp/main/html/rd/p/000000009.000067318.html
NoCoders Japan協会は、ノーコードと生成AIの最新カオスマップを公開。ユーザーがプロジェクトに最適なツールを選びやすくしました。

生成AIで個別指導の質向上、教育格差に挑むスタンフォード新ツール

https://www.technologyreview.jp/s/349035/this-ai-system-makes-human-tutors-better-at-teaching-children-math/
スタンフォード大学が開発したGPT-4ベースのツールが、チューター向けに助言を生成。教育の質を向上し、格差解消に貢献します。

AI周辺ニュース

孫正義氏、「日本的な生成AI」をバッサリ--「『パラメーターが少ないから効率的』は予算がない言い訳」

https://japan.cnet.com/article/35224535/
孫正義氏は、生成AIにおいてパラメーター数を抑える手法を「予算不足の言い訳」と批判。大規模なAIモデルが進化の鍵と主張しました。

ノーベル物理学賞に「AIの父」、ヒントン氏とホップフィールド氏

https://www.nikkei.com/article/DGXZQOSG082220Y4A001C2000000/
ジョン・ホップフィールド氏とジェフリー・ヒントン氏が、機械学習の発見で2024年ノーベル物理学賞を受賞しました。

ノーベル化学賞にGoogle研究者ら　たんぱく質解析用AI

https://www.nikkei.com/article/DGXZQOUC295N40Z20C23A9000000/
Google DeepMindの研究者らが、たんぱく質構造解析のAI技術でノーベル化学賞を受賞。生命科学と創薬に大きな貢献をしました。

【ポッドキャスト】ウソをつかない生成AIはこれだ　50モデル比較を3分解説　NIKKEI Digital Governance × NIKKEI PODCAST

https://www.nikkei.com/article/DGXZQODL1858X0Y4A910C2000000/
NIKKEI Digital Governanceが、日本語対応の生成AI50モデルを比較し、信頼性の高いモデルを紹介。生成AIのハルシネーション問題に焦点を当てています。

“AIピザ”爆誕　ピザハット、AI活用で全ピザのチーズ量を130％に増量へ　生成AIでWebCMも作成

【10・21】ＡＩピザ【爆誕】 - YouTube

富士通、生成AIでシステム更新時間半減　トヨタ系と実証

正念場のG7「AI監視網」　日米と欧州、すれ違う思惑

ノーコード＆AIカオスマップ更新【2024年10月版】

生成AIで個別指導の質向上、教育格差に挑むスタンフォード新ツール

AI関連ニュース

孫正義氏、「日本的な生成AI」をバッサリ--「『パラメーターが少ないから効率的』は予算がない言い訳」

ノーベル物理学賞に「AIの父」、ヒントン氏とホップフィールド氏

ノーベル化学賞にGoogle研究者ら　たんぱく質解析用AI

【ポッドキャスト】ウソをつかない生成AIはこれだ　50モデル比較を3分解説　NIKKEI Digital Governance × NIKKEI PODCAST

「大きいことはいいことだ」大規模言語モデルの呪縛を解く

https://www.technologyreview.jp/s/347168/why-bigger-is-not-always-better-in-ai/
AI業界での「スケールこそすべて」の思想が、巨大テック企業による大規模モデルの独占を招いています。しかし、比較的小規模なモデルでも、特定のタスクにおいて大規模モデルに匹敵する性能を発揮できる場合があります。

【論文瞬読】LightRAG：グラフ構造が切り拓く次世代の情報検索と生成の世界

https://note.com/ainest/n/n8e853ae21697
LightRAGは、最新の自然言語処理技術であり、従来のRAG（Retrieval-Augmented Generation）の課題を解決します。グラフ構造を使った情報整理と二段階検索により、より速く柔軟な情報検索と生成が可能になり、法律やビジネス分野での活用が期待されています。

富士通、世界初の“偽情報検知システム”構築へ　NEC・NIIなど9者が協力　2025年度末の提供目指す

https://www.itmedia.co.jp/aiplus/articles/2410/16/news143.html
富士通は、生成AIによる偽情報を検知する世界初のシステムを構築します。このシステムは偽情報の生成元を分析し、根拠を収集・管理、統合分析を行い、自治体や企業に提供する予定です。

米アマゾン、原発事業に参入　次世代炉開発支援、電源確保へ

https://nordot.app/1219402839616521142
アマゾンは、次世代原子炉「小型モジュール炉（SMR）」の商用化を支援する契約を締結しました。AIの利用拡大に伴い、安定した電力供給を目指す動きです。

アマゾン原発開発に関わる企業に投資と発表 AI利用拡大で安定した電力確保の動き

https://www3.nhk.or.jp/news/html/20241017/k10014611641000.html
アマゾンは、SMRの開発企業への投資を発表し、データセンターの消費電力増加に対応するための施策を進めています。

筆者のひとりごと

１０月はOpenAIを含む、メインどころの生成AI会社のアップデートが目白押しで、生成AIを解説している人たちはてんやわんやな一ヶ月でした。

また、１０月は動画・画像生成AIだけでなく、音楽生成AI関連の大幅なアップデートや新しいサービスがリリースされて、クリエイティブ領域の生成AI活用もどんどんと現実味が増してきています。

生成AIの活用について、自主開催のセミナーを今月から強化しているのですが、その中で感じることは、生成AIの便利さを実感してもらうには、実際に目の前にある課題を解決するのが一番だということ

例えば、手書き書類をChatGPTを使ったAI-OCRでテキスト化して整形するだけで、生成AIの有効性を感じてもらえます。

生成AIはどんどん進化していって、できることが増えていきますが、それがどの様に業務を楽にしてくれるのか、サービスの質を向上してくれるのか、ひいては利益に直結するのか

それを具体的にお伝えして、実感してもらうのが大切だなと感じる１ヶ月でした。

最後まで御覧いただきましてありがとうございました！

この記事が「ためになった」と思ったら、いいね！やSNSで紹介いただけると嬉しいです🙏

生成AIアドバイザー
灰藤健吾

【忙しい人のために】生成AI関連のニュースまとめました | 2024年10月

【告知】実践的な生成AI活用セミナーを開催します！

OpenAI、ChatGPT関係

OpenAI⁠⁠、ChatGPTの新機能「canvas」をリリース。執筆やコーディング作業を支援

【OpenAI公式】ChatGPTのプロンプトジェネレーターで自動生成！始め方や使い方と料金

「ChatGPT」、「Windows」版アプリがようやく登場--まずは有料ユーザーから

【Realtime API】OpenAIが音声会話可能なモデルのAPIを公開！音声サービスの開発が簡単に

OpenAI unveils experimental 'Swarm' framework, igniting debate on AI-driven automation

faster-whisperでWhisper Turboとlarge-v3の速度と精度を比較

OpenAI幹部がChatGPTの収益を語る、週間アクティブユーザーは2億5000万人で収益の75％は一般有料ユーザー

OpenAI, Microsoft in $14B tussle over equity rights in AI giant: report

OpenAIが1兆円調達 生成AI「勝者総取り」の規模追求へ

ソフトバンクがOpenAIに720億円を投資か？AI業界に大きな変化が迫る

OpenAIの共同創業者がまた1人、Anthropic入り

元OpenAI社員の告発｢OpenAIは著作権法をやぶりまくっている｣

その他生成AIサービス

Anthropic、「Claude 3.5 Sonnet」更新と「Claude Haiku 3.5」リリースを発表

900行のコードをノーミスで出力するClaude 3.5 Sonnet (New) やるなお主

【働き方に革命】AIがパソコンを支配する。驚きのClaude最新アップデート「Computer User demo」を徹底解説。

Claudeで3000行のCSVファイルをリアルタイムにグラフ化し分析する | DevelopersIO

Updated production-ready Gemini models, reduced 1.5 Pro pricing, increased rate limits, and more

Google updates: AI-Organized Search, Google Lens, and more

グーグルの「NotebookLM」を使ったAIポッドキャストが注目されている

急成長するGoogleのAIノート「NotebookLM」、実験から格上げ、企業利用も加速

Gemini に新しい機能が追加：Imagen 3 による画像生成とカスタム Gem

Google Workspace、生成AIアシスタント機能が日本語に対応 GmailやGoogle ドライブ内の資料要約などが可能に

【速報】Gemini サイドパネルが日本語対応開始！Workspace での AI 活用が加速

すべての人に AI アシスタントを - News Center Japan

Copilotが危ない？ 生成AIから「認証情報が盗まれる」手口が明らかに

Apple、新型iMacに半導体｢M4｣搭載 生成AI機能「Apple Intelligence」に対応

Apple、新型「Mac mini」11月8日発売 M4・M4 Pro搭載で9万円台から

メタ、新たなAIモデル「Movie Gen」を発表。動画生成のフロンティアに参入

Metaがモバイルデバイスで実行できる軽量な量子化Llamaモデルをリリース

アドビの「PDF向け生成AI」が2025年初頭に日本語対応へ…生成AIでPDFの用途を拡大

Gensparkがパートナーデータソース統合とAutopilot Agentのアップグレードを発表

AI検索の「Perplexity」、公開情報と社内のナレッジを統合する新機能

【遂にリリース】Perplexityが推論特化検索を提供開始！スモールビジネスにどのように役立つか

Feloの新機能「深度検索」完全ガイド：効果的な活用方法とおすすめプロンプト50選

Announcing FLUX1.1 [pro] and the BFL API

Send Your Interactive Avatar to Zoom Meetings

【衝撃】AIアバターとリアルタイム会話！HeyGenの進化がヤバすぎる！

【Hailuo AI】無料で使えるのにハイクオリティーな動画生成AI

AI生成キャラクターをリアルな表情でアニメーションさせられるツール「Act-One」をRunwayがリリース

Suno AIのiPhoneアプリ、日本のApp Storeに登場。「スノー - AI音楽」で写真やビデオをその場で音楽に

画像生成AIの中でガチリアルといわれるRecraft V3とは？使い方を解説

キャラクターにダンスさせられる「Animate-X」が登場！

AIを活用したUI作成ツール「v0」の新プランが登場！スモールビジネスに最適な理由とは？

わずか10秒の元音声でもリアルな「なりきりボイチェン」できる無料ソフト『Seed-VC』は過去最高レベルの再現度か

【音声クローン作成】たった2秒の音声からAI音声合成！E2-F5-TTSで自分の声をクローン化する方法

【ElevenLabs】超ハイレベルなオーディオ生成AIが登場！使い方を徹底解説

生成AI活用事例

ハローワーク、生成AI導入を検討 マッチングの効率化狙う OpenAI Japanの協力も視野に

桂文枝、生成AIと共作で“創作落語” 手応え十分「落語というのは“心”です」

JR東が「鉄道版生成 AI」開発へ 鉄道固有の知識を学習、経験浅い社員の知識レベル底上げに

Uber gives users option to only hail full-electric vehicles, launches AI chatbot

東京メトロ、生成AIで問い合わせ対応 「100％の性能でなくても実用化」を決断できたワケ

顔写真を「ONE PIECE」風に変換する「似顔絵メーカー」 尾田栄一郎氏「エロい写真も？聞いてみました」

キリン、新卒採用に“AI面接官”を試験導入 生成AI利用で「人間の約6倍多角的に評価できる」

“AIピザ”爆誕 ピザハット、AI活用で全ピザのチーズ量を130％に増量へ 生成AIでWebCMも作成

【10・21】ＡＩピザ【爆誕】 - YouTube

富士通、生成AIでシステム更新時間半減 トヨタ系と実証

正念場のG7「AI監視網」 日米と欧州、すれ違う思惑

ノーコード＆AIカオスマップ更新【2024年10月版】

生成AIで個別指導の質向上、教育格差に挑むスタンフォード新ツール

AI周辺ニュース

孫正義氏、「日本的な生成AI」をバッサリ--「『パラメーターが少ないから効率的』は予算がない言い訳」

ノーベル物理学賞に「AIの父」、ヒントン氏とホップフィールド氏

ノーベル化学賞にGoogle研究者ら たんぱく質解析用AI

【ポッドキャスト】ウソをつかない生成AIはこれだ 50モデル比較を3分解説 NIKKEI Digital Governance × NIKKEI PODCAST

“AIピザ”爆誕 ピザハット、AI活用で全ピザのチーズ量を130％に増量へ 生成AIでWebCMも作成

【10・21】ＡＩピザ【爆誕】 - YouTube

富士通、生成AIでシステム更新時間半減 トヨタ系と実証

正念場のG7「AI監視網」 日米と欧州、すれ違う思惑

ノーコード＆AIカオスマップ更新【2024年10月版】

生成AIで個別指導の質向上、教育格差に挑むスタンフォード新ツール

AI関連ニュース

孫正義氏、「日本的な生成AI」をバッサリ--「『パラメーターが少ないから効率的』は予算がない言い訳」

ノーベル物理学賞に「AIの父」、ヒントン氏とホップフィールド氏

ノーベル化学賞にGoogle研究者ら たんぱく質解析用AI

【ポッドキャスト】ウソをつかない生成AIはこれだ 50モデル比較を3分解説 NIKKEI Digital Governance × NIKKEI PODCAST

OpenAIが1兆円調達　生成AI「勝者総取り」の規模追求へ

Google Workspace、生成AIアシスタント機能が日本語に対応　GmailやGoogle ドライブ内の資料要約などが可能に

Copilotが危ない？　生成AIから「認証情報が盗まれる」手口が明らかに

Apple、新型iMacに半導体｢M4｣搭載　生成AI機能「Apple Intelligence」に対応

Apple、新型「Mac mini」11月8日発売　M4・M4 Pro搭載で9万円台から

ハローワーク、生成AI導入を検討　マッチングの効率化狙う　OpenAI Japanの協力も視野に

桂文枝、生成AIと共作で“創作落語”　手応え十分「落語というのは“心”です」

JR東が「鉄道版生成 AI」開発へ　鉄道固有の知識を学習、経験浅い社員の知識レベル底上げに

東京メトロ、生成AIで問い合わせ対応　「100％の性能でなくても実用化」を決断できたワケ

顔写真を「ONE PIECE」風に変換する「似顔絵メーカー」　尾田栄一郎氏「エロい写真も？聞いてみました」

キリン、新卒採用に“AI面接官”を試験導入　生成AI利用で「人間の約6倍多角的に評価できる」

“AIピザ”爆誕　ピザハット、AI活用で全ピザのチーズ量を130％に増量へ　生成AIでWebCMも作成

富士通、生成AIでシステム更新時間半減　トヨタ系と実証

正念場のG7「AI監視網」　日米と欧州、すれ違う思惑

ノーベル化学賞にGoogle研究者ら　たんぱく質解析用AI

【ポッドキャスト】ウソをつかない生成AIはこれだ　50モデル比較を3分解説　NIKKEI Digital Governance × NIKKEI PODCAST

“AIピザ”爆誕　ピザハット、AI活用で全ピザのチーズ量を130％に増量へ　生成AIでWebCMも作成

富士通、生成AIでシステム更新時間半減　トヨタ系と実証

正念場のG7「AI監視網」　日米と欧州、すれ違う思惑

ノーベル化学賞にGoogle研究者ら　たんぱく質解析用AI

【ポッドキャスト】ウソをつかない生成AIはこれだ　50モデル比較を3分解説　NIKKEI Digital Governance × NIKKEI PODCAST

富士通、世界初の“偽情報検知システム”構築へ　NEC・NIIなど9者が協力　2025年度末の提供目指す

米アマゾン、原発事業に参入　次世代炉開発支援、電源確保へ

アマゾン原発開発に関わる企業に投資と発表 AI利用拡大で安定した電力確保の動き