[05/18~05/24] 生成AI Weekly News|Microsoft Buildをピックアップ
今回も社内で話題になった生成AIに関するニュースをご紹介します。
先週は OpenAI と Google から発表がありましたが、今週は Microsoft から発表がありました。
毎週たくさんの生成AI News で溢れかえってますね。ぜひこの記事でまとめてキャッチアップをしてください!
それでは今週のニュースです!
ピックアップ!|Microsoft Build 2024
まずは先日行われた、Microsoft Build(MS Build)の情報をピックアップしてご紹介します。
MicrosoftがAIファーストなPC「Copilot+ PC」を発表
PC のローカル上で生成AI を実行できる「Copilot+ PC」が発表されました。Windows に 40以上のオンデバイス AIモデルが搭載されるとのこと。
生成AI を動かすことに特化した PC とのことで、よりマルチモーダルに生成AI を使うことが可能に。
「Github Copilot Extension」を発表
サードパーティのツールやサービスの機能をGitHub Copilotに追加できる「GitHub Copilot Extensions」が発表されました。開発者は IDE や GitHub.com から離れることなく、好きなツールやサービスを使用しながら自然言語で AI とやりとりし、開発を進めることができる模様。
Microsoft 「Edge」の新AI機能を発表、動画を音声吹き替えと字幕でリアルタイム翻訳できるように
多言語リアルタイム翻訳機能を追加すると発表がありました。
これによって、YouTube、LinkedIn、CNBC、Bloomberg などのサイトにある動画を、指定した言語でリアルタイムで翻訳してくれるようです。音声のも字幕にも対応するとのことです。
こちらはそのデモです。
Microsoft、自律型AIソフトウェアエンジニア「Devin」のCognition AIと提携を発表。Azure上でDevinを提供へ
コード生成のみならず、システム設計からデバッグ、デプロイまでをプロンプトでよしなに行なってくれる完全自律型AIソフトウェアエンジニアの Devin が Azure 上で使えるようになるとのこと。
他にもわかりやすくまとめられている記事がありますので、ご紹介します。
プロダクト・サービス
GPT-4o、Gemini 1.5 Flash の性能
先週登場した GPT-4o と Gemini 1.5 Flash ですが、性能に関する様々な検証結果が共有されています。
現時点では、まだまだ検証を進めていってる段階ですが、その一部を紹介します。
結論としては、
GPT-4o は Claude 3 Opus / GPT-4 Turbo と比較しても、それなりに優秀なモデルっぽい
Gemini 1.5 Flash は、スピード・価格・性能の観点で見たときにコスパが優れているっぽい
曖昧な表現になってしまいますが、現時点で "確実にどのモデルが優れている" と決めるのは難しく、引き続き情報のキャッチアップが必要です。
OpenAI、音声入力のみからナレーション/BGM付きの動画を自動生成するデモを公開
VivaTech というイベントで OpenAI が、音声入力のみで
Soraでビデオを作成
ChatGPTに送ってスクリプトを作成
Voice Engineを使ってナレーション作成
ができるデモを公開しました。
Google 「Ask Photo」機能公開
Google から新しく「Ask Photo」機能が公開されました。
Gemini を活用することで、Google フォトで下記ができるようになったようです。
直感的に適切なコンテンツを見つける
質問して役立つ回答を得る
AI が面接を行う 「Apriora|Alex」
Apriora はライブビデオや電話インタビューを行う AI インタビュアーの Alex を開発した。
Alex はパーソナライズされた会話体験を提供し、包括的な採用インサイトを生成する、と紹介されています。
OSSで登場したチャットアプリ 「RAGAPP」
ニュース
AI 戦略会議
5/22(水)の内閣府で行われた、AI戦略会議の資料が公開されています。
その中でも、「生成AIの産業における可能性」松尾研究室の内容がとても面白かったので一部ご紹介します。
https://www8.cao.go.jp/cstp/ai/ai_senryaku/9kai/shiryo1-4.pdf
EU、AI の開発/運用を規制する「AI法」が成立。世界初
EU 理事会が現地時間 5/21 に、AI 利用を規制する「AI 法」を承認しました。来月には発効、2年後の2026年に本格的に適用される見通しとのこと。
米 Cousera、世界の大学講座を生成AI で日本語に翻訳
オンライン教育サービスの cousera が、生成AI を活用してオンライン講座を英語から日本語に自動翻訳して提供をする模様。
良質なコンテンツが揃っているものの、そのほとんどが英語の情報だっため、嬉しいニュースです。
論文・技術系
[論文] LLMでカテゴリ説明文を生成しニュース推薦の性能をググッと向上させる手法
[論文] RAGシステムの失敗パターン
生成AI を用いた社内データ活用に使われる技術「RAG」ですが、7つの失敗パターンと考慮すべきポイントが書かれている論文です。
< 失敗パターン >
データ不足
検索漏れ
コンテキスト化の失敗
プロンプト処理の失敗
フォーマットの不一致
具体性の欠如
回答の不完全さ
[論文] LLMに"できるだけ正確に長文を読解させる"プロンプト手法
Googleが開発した「LLMに長文を高精度で読解させる方法論」と実行プロンプトについて書かれている論文です。
基本形は「ページを区切る→短い要約を繰り返す→必要に応じてメモリを参照する」という、読書が得意な人間が行なっているプロセスを分析して模倣しているとのこと。Google による研究。
その他ニュース
Google、Google Meet上で同じ部屋に複数のパソコンがあることを自動的に認識して一つの音声に統合してくれる「adaptive audio」機能を発表
ヤマダ、ロボット接客を導入へ 店員の接客スキルを学習した「接客AIサービス」開発に向け
中国バイドゥ、自動運転レベル4対応の大規模言語モデルを発表
中国 IT大手の百度(バイドゥ)が、レベル4の自動運転に対応する世界初の大規模言語モデル「Apollo ADFM(Autonomous Driving Foundation Model)」を発表しました。
OpenAI が News Corp と提携
OpenAIは、News Corp と提携し、ウォールストリート・ジャーナル(WSJ)、バロンズ、マーケットウオッチなどのコンテンツ表示が可能になります。コンテンツの提供に加えて、News Corp はジャーナリズムの専門知識を共有し、OpenAI の提供内容全体で最高のジャーナリズム基準が確保されるように支援する模様。
https://openai.com/index/news-corp-and-openai-sign-landmark-multi-year-global-partnership/
[ご案内] 生成AI活用のお悩み相談、開催中
現在弊社では、生成AI 活用をご検討されている企業様のお悩み相談を、
1時間無料で受け付けております。
業務効率化のための法人向け ChatGPT 環境のサービスや、生成AI に関する研修にご興味がある方は、コチラから。
今週もニュースが盛りだくさんの1週間でした。来週もどんなニュースがあるのか楽しみです!
今週もお疲れ様でした!
=========================================
この note が気に入ってくれた方は、
ぜひ「いいね」と「フォロー」をお願いします♪
X でも生成 AI や LLM に関する情報を発信してますので、
ぜひ覗いてみてください!
「株式会社エクスプラザ(公式)」アカウント
https://twitter.com/explaza_inc
「生成AI事例集」アカウント
https://twitter.com/explaza_usecase
生成AI事例集
会社HP
この記事が気に入ったらサポートをしてみませんか?