[05/18~05/24] 生成AI Weekly News｜Microsoft Buildをピックアップ

株式会社エクスプラザ（公式）

2024年5月24日 18:31

今回も社内で話題になった生成AIに関するニュースをご紹介します。
先週は OpenAI と Google から発表がありましたが、今週は Microsoft から発表がありました。

毎週たくさんの生成AI News で溢れかえってますね。ぜひこの記事でまとめてキャッチアップをしてください！

それでは今週のニュースです！

ピックアップ！｜Microsoft Build 2024

まずは先日行われた、Microsoft Build（MS Build）の情報をピックアップしてご紹介します。

MicrosoftがAIファーストなPC「Copilot+ PC」を発表

PC のローカル上で生成AI を実行できる「Copilot+ PC」が発表されました。Windows に 40以上のオンデバイス AIモデルが搭載されるとのこと。

生成AI を動かすことに特化した PC とのことで、よりマルチモーダルに生成AI を使うことが可能に。

「Github Copilot Extension」を発表

サードパーティのツールやサービスの機能をGitHub Copilotに追加できる「GitHub Copilot Extensions」が発表されました。開発者は IDE や GitHub.com から離れることなく、好きなツールやサービスを使用しながら自然言語で AI とやりとりし、開発を進めることができる模様。

Microsoft 「Edge」の新AI機能を発表、動画を音声吹き替えと字幕でリアルタイム翻訳できるように

多言語リアルタイム翻訳機能を追加すると発表がありました。
これによって、YouTube、LinkedIn、CNBC、Bloomberg などのサイトにある動画を、指定した言語でリアルタイムで翻訳してくれるようです。音声のも字幕にも対応するとのことです。

こちらはそのデモです。

Microsoft、自律型AIソフトウェアエンジニア「Devin」のCognition AIと提携を発表。Azure上でDevinを提供へ

コード生成のみならず、システム設計からデバッグ、デプロイまでをプロンプトでよしなに行なってくれる完全自律型AIソフトウェアエンジニアの Devin が Azure 上で使えるようになるとのこと。

Meet Devin: an autonomous AI software agent from @cognition_labs, now scaling with Microsoft Azure. From code migrations to engineering efficiency, Devin will help engineers save time and achieve more. #MSBuild pic.twitter.com/gs5W9zBS99
— Microsoft Developer (@msdev) May 21, 2024

We are partnering with Microsoft to help bring Devin to every developer.

Under the partnership, Microsoft will use Devin to help its developers achieve more, starting with code migrations and modernization, and bring Devin to its customer base. Devin will be powered by Azure. pic.twitter.com/7xSwc2flAr
— Cognition (@cognition_labs) May 21, 2024

他にもわかりやすくまとめられている記事がありますので、ご紹介します。

[MSBuild Keynoteまとめ]
結構もりもりだったので備忘録。

１．Copilot＋PC、AIフレームワーク
・ローカルで４０以上のLLMにアクセス可能
（Phiが含まれる）
・RAGアプリのためにローカルデータで独自のアプリ構築が可能に… pic.twitter.com/Sa0Yrwhbp0
— ホーダチ | AI✖️Cloud✖️Dev | 外資×ひとり法人 (@hokazuya) May 21, 2024

プロダクト・サービス

GPT-4o、Gemini 1.5 Flash の性能

先週登場した GPT-4o と Gemini 1.5 Flash ですが、性能に関する様々な検証結果が共有されています。

現時点では、まだまだ検証を進めていってる段階ですが、その一部を紹介します。

Graph showcasing LLMs performance in the “Needle in the Haystack” task

gpt-4o claims to outperform claude opus.

I don't trust benchmarks.

So I ran my own tests:
test #1 → analyze a 42-page PDF pic.twitter.com/k2aCkNzzbW
— Ruben Hassid (@RubenHssd) May 15, 2024

結論としては、

GPT-4o は Claude 3 Opus / GPT-4 Turbo と比較しても、それなりに優秀なモデルっぽい
Gemini 1.5 Flash は、スピード・価格・性能の観点で見たときにコスパが優れているっぽい

曖昧な表現になってしまいますが、現時点で "確実にどのモデルが優れている" と決めるのは難しく、引き続き情報のキャッチアップが必要です。

OpenAI、音声入力のみからナレーション/BGM付きの動画を自動生成するデモを公開

VivaTech というイベントで OpenAI が、音声入力のみで

Soraでビデオを作成
ChatGPTに送ってスクリプトを作成
Voice Engineを使ってナレーション作成

ができるデモを公開しました。

やっぱりOpenAIすごすぎる。。。

OpenAIは音声入力のみから自動でナレーション, BGM付き動画を生成するこれまで未公開のデモを披露しました。

台本はChatGPT、ナレーションはOpenAIのVoice Engine、動画はSoraで生成されています。 pic.twitter.com/AyBPo4rZTB
— ChatGPT研究所 (@ctgptlb) May 23, 2024

Google 「Ask Photo」機能公開

Google から新しく「Ask Photo」機能が公開されました。
Gemini を活用することで、Google フォトで下記ができるようになったようです。

直感的に適切なコンテンツを見つける
質問して役立つ回答を得る

AI が面接を行う「Apriora｜Alex」

Apriora はライブビデオや電話インタビューを行う AI インタビュアーの Alex を開発した。
Alex はパーソナライズされた会話体験を提供し、包括的な採用インサイトを生成する、と紹介されています。

3. Apriora (@aprioraai)

Round: $2.8M Seed

Apriora built an AI interviewer named Alex, which conducts live video and phone interviews.

Alex provides a personalized, conversational experience and generates comprehensive hiring insights.

Live interview: pic.twitter.com/TUHP5ff7Ff
— Chief AI Officer (@chiefaioffice) May 19, 2024

OSSで登場したチャットアプリ「RAGAPP」

OSSで登場したチャットアプリ：RAGAPP

RAGが実装されていて、GPT-4oやGeminiも実装されているDockerイメージ「RagApp」が公開されてた。

なんやシンプルな企業向けチャットで、GPT-4o導入しませんか！とかいうようなアプローチだと、これでええんちゃう？となりそうなくらい基本機能が実装されてる。… pic.twitter.com/xk33PRyIku
— ホーダチ | AI✖️Cloud✖️Dev | 外資×ひとり法人 (@hokazuya) May 23, 2024

ニュース

AI 戦略会議

5/22(水)の内閣府で行われた、AI戦略会議の資料が公開されています。

その中でも、「生成AIの産業における可能性」松尾研究室の内容がとても面白かったので一部ご紹介します。

https://www8.cao.go.jp/cstp/ai/ai_senryaku/9kai/shiryo1-4.pdf

EU、AI の開発/運用を規制する「AI法」が成立。世界初

EU 理事会が現地時間 5/21 に、AI 利用を規制する「AI 法」を承認しました。来月には発効、2年後の2026年に本格的に適用される見通しとのこと。

違反した企業には最大で3500万ユーロ、日本円でおよそ60億円か、年間の売上高の7％か、どちらか高いほうが制裁金として科されるという厳しい内容になっています。

米 Cousera、世界の大学講座を生成AI で日本語に翻訳

オンライン教育サービスの cousera が、生成AI を活用してオンライン講座を英語から日本語に自動翻訳して提供をする模様。
良質なコンテンツが揃っているものの、そのほとんどが英語の情報だっため、嬉しいニュースです。

論文・技術系

[論文] LLMでカテゴリ説明文を生成しニュース推薦の性能をググッと向上させる手法

論文書きました😘

推薦システムでアイテムのカテゴリ情報は重要だけど単体だと推薦モデルが解釈しづらいよね〜、という課題感からLLMでカテゴリ説明文を生成しニュース推薦の性能をググッと向上させたという話です

推薦/NLPどちらの人も楽しめる内容だと思います。是非っ!https://t.co/iEm3By3ncV pic.twitter.com/62JUNTcgrN
— Yuki Yada / 矢田宙生 (@arr0w_swe) May 24, 2024

[論文] RAGシステムの失敗パターン

生成AI を用いた社内データ活用に使われる技術「RAG」ですが、7つの失敗パターンと考慮すべきポイントが書かれている論文です。

< 失敗パターン >

データ不足
検索漏れ
コンテキスト化の失敗
プロンプト処理の失敗
フォーマットの不一致
具体性の欠如
回答の不完全さ

[論文] LLMに"できるだけ正確に長文を読解させる"プロンプト手法

Googleが開発した「LLMに長文を高精度で読解させる方法論」と実行プロンプトについて書かれている論文です。

基本形は「ページを区切る→短い要約を繰り返す→必要に応じてメモリを参照する」という、読書が得意な人間が行なっているプロセスを分析して模倣しているとのこと。Google による研究。

その他ニュース

Google、Google Meet上で同じ部屋に複数のパソコンがあることを自動的に認識して一つの音声に統合してくれる「adaptive audio」機能を発表

ヤマダ、ロボット接客を導入へ　店員の接客スキルを学習した「接客AIサービス」開発に向け

中国バイドゥ、自動運転レベル4対応の大規模言語モデルを発表

中国 IT大手の百度（バイドゥ）が、レベル4の自動運転に対応する世界初の大規模言語モデル「Apollo ADFM（Autonomous Driving Foundation Model）」を発表しました。

OpenAI が News Corp と提携

OpenAIは、News Corp と提携し、ウォールストリート・ジャーナル（WSJ）、バロンズ、マーケットウオッチなどのコンテンツ表示が可能になります。コンテンツの提供に加えて、News Corp はジャーナリズムの専門知識を共有し、OpenAI の提供内容全体で最高のジャーナリズム基準が確保されるように支援する模様。

https://openai.com/index/news-corp-and-openai-sign-landmark-multi-year-global-partnership/

[ご案内] 生成AI活用のお悩み相談、開催中

現在弊社では、生成AI 活用をご検討されている企業様のお悩み相談を、
1時間無料で受け付けております。

相談はコチラをクリック

EXPLAZA 生成AI Partner では、生成AI 活用について幅広くお手伝いしています。

業務効率化のための法人向け ChatGPT 環境のサービスや、生成AI に関する研修にご興味がある方は、コチラから。

今週もニュースが盛りだくさんの1週間でした。来週もどんなニュースがあるのか楽しみです！

今週もお疲れ様でした！

=========================================
この note が気に入ってくれた方は、
ぜひ「いいね」と「フォロー」をお願いします♪

X でも生成 AI や LLM に関する情報を発信してますので、
ぜひ覗いてみてください！

「株式会社エクスプラザ（公式）」アカウント
https://twitter.com/explaza_inc
「生成AI事例集」アカウント
https://twitter.com/explaza_usecase

生成AI事例集

会社HP