【5/20-5/26】生成AI活用事例/研究開発-Weeklyまとめ

2023年5月26日 18:44

今週のAIに関する活用事例や研究開発情報をまとめた記事です。

活用事例

・本当に使える #ChatGPT プラグインはどれなのか？｜IT navi @itnavi2022 #note #plugin

＊先に答えを言います。WebPilotとAskYourPDFとShow Meと Wolframです。
本当に使える #ChatGPT プラグインはどれなのか？｜IT navi @itnavi2022 #note #plugin https://t.co/kntlGSYtfm
— IT navi (@itnavi2022) May 18, 2023

・おーーー
AI Beatles
RunwayのGen2とGoogleのMusicLMで作られてるとのこと
Reddit: https://t.co/PO21dNZdIk
Youtube: https://t.co/i78KxIs5lB https://t.co/MiEZTaiJV4

AI Beatles: A Sonic Journey Through The Decades, Runway Gen-2 and Google MusicLM

reddit thread: https://t.co/gUybmQOjJ4 pic.twitter.com/q7To2iFGxG
— AK (@_akhaliq) May 17, 2023

・極予測AI

極予測AIにおいて、大規模言語モデルを活用した「広告コピー自動生成機能」を実装いたしました。
自社LLM技術およびChatGPTの活用により、画像やターゲットを考慮した広告コピーの生成が可能となりました。今後も、広告効果の最大化に尽力してまいります。https://t.co/5A38nVVt2v
— サイバーエージェント　広報＆IR担当 (@CyberAgent_PR) May 18, 2023

・iOS用ChatGPTアプリがアメリカで配信開始！
-今後数週間でさらに多くの国に拡大
-無料
-デバイス間で履歴を同期
-Whisper も統合され音声入力が可能
App Store: https://t.co/pavzm2ebPk
Android: next
記事: https://t.co/oz93ygouWH https://t.co/jModSXrzh3

Introducing the ChatGPT app for iOS! We’re live in the US and will expand to additional countries in the coming weeks. Android is next! https://t.co/p3PfTtxL9i
— OpenAI (@OpenAI) May 18, 2023

・sketch-to-skybox
1,ラフなスケッチをして
2,プロンプトを書き
3, 生成ボタンを押す
だけで360度ビューが生成されてる
モバイル版も近日公開予定だとか

Draw your world! 🧙‍♂️🖌🌐

Sketch-to-skybox introduces a whole new palette of tools to let you architect your new skyboxes better than ever. Try it with Remix for maximum effect!

GET SKETCHING: https://t.co/degS4wvbpf #GenAI #aiart #gamedev #skybox #sketchtoskybox pic.twitter.com/PdRJd2xGTu
— Blockade Labs (@BlockadeLabs) May 18, 2023

・大規模言語モデルの開発者が知っておくと役立つさまざまな数字

・Cue：AI ブラウザアシスタント
-Adeptのようなブラウジング自動化サービス
-シンプルなテキストで Web を閲覧
-やっぱりwaiting list

Introducing Cue: your AI Browser Assistant.

Say hello to a new era of browsing the web with simple text commands!

We're building Cue to handle your daily browsing tasks fast and effortlessly. 🚀 pic.twitter.com/onC5oYsnwh
— Samip Dahal (@samipddd) May 18, 2023

・Googleの Lookout アプリ内でFlamingo を使用した機能が追加
-視覚障害者や弱視コミュニティの人々をサポート
-画像の説明を自動生成でき、ユーザーはフォローアップの質問が可能

How can we use AI to make the world around us more accessible? 💡

Today, we’re proud to help launch a new visual question and answer feature within @Google’s Lookout app, designed to support blind people and those from low vision communities. https://t.co/nfB7yroJXh #GAAD2023 pic.twitter.com/nIZ6tG6zim
— Google DeepMind (@DeepMind) May 18, 2023

・インタラクティブな検索体験のPerplexity Copilotが登場
-依頼を投げると、必要情報をヒアリングしてくれ、複数の回答と要約を提供してくれる
-ヘッドフォンを探す際の値段を設定したり、旅行計画の際の候補都道府県をヒアリングなど
-GPT-4により回答(4時間5回制限)

The next iteration of Perplexity has arrived: Copilot, your interactive AI search companion. 🚀🤖 Perplexity Copilot guides your search experience with interactive inputs, leading you to a rich, personalized answer, powered by GPT-4. Try it for free at https://t.co/ut3wdOwUEd pic.twitter.com/AGrgBELOAE
— Perplexity AI (@perplexity_ai) May 18, 2023

・スタートアップのSkyflowは、生成AIに暗号化をもたらす
-大規模言語モデルを学習する過程で、企業が機密データを非公開にできる新しいクラウドサービスを開始
-Salesforceの元幹部が設立したデータ・プライバシーのスタートアップ

・Googleが新しいAIモデルを広告に使用し、YouTubeクリエイターを支援する計画と、情報筋が語る
-また、新たなAIモデルを用いて、自社製品の接客を一部自動化する予定
-画像作成のためのStable Diffusionのような製品を社内で開発も

・Fintech Rampは、企業向け節約AIツールの提供を開始
-Ramp Intelligenceは、GPT-4を活用し、ソフトウェア価格分析、電子メールの領収書スキャン、経費報告書の監査、顧客問い合わせに対応するサービス群を備える
-MicrosoftのCEOがRampの投資家およびアドバイザーとして参加

NEW: Ramp Intelligence

Meet our newest suite of AI tools, all designed to save your business thousands of dollars.

All built directly into Ramp. Here is how it works 👇 pic.twitter.com/mImo00tHkS
— Ramp (@tryramp) May 18, 2023

・【NewsPresso（ニュースプレッソ）】β版5月19日開始 GPTを活用し海外ニュース記事を要約して紹介

やっぱり出てきたな☞【NewsPresso（ニュースプレッソ）】β版5月19日開始 GPTを活用し海外ニュース記事を要約して紹介ビジネスやテック関連情報などを日本語で紹介、グノシー運営のノウハウを応用し試験運用｜株式会社Gunosy（グノシー）｜情報を世界中の人に最適に届ける https://t.co/3JNOGgMfiw
— Masanori Kusunoki / 楠正憲 (@masanork) May 19, 2023

・Bingのプレビューリリースで、グラフ表示などできるように
chatgptがブラウジング含め何でもできるマンになってるけど、Bingどうなるんやろうか
無料とはいえ、Googleからユーザー取れてない疑惑のデータも上がってたし

・「紙飛行機で世界中を自由に飛び回れるゲーム」のデモが公開、「ChatGPT」「Unreal Engine 5」など注目技術てんこ盛りで圧巻の出来栄え

「紙飛行機で世界中を自由に飛び回れるゲーム」のデモが公開、「ChatGPT」「Unreal Engine 5」など注目技術てんこ盛りで圧巻の出来栄えhttps://t.co/1ZE5q3lQvq
— GIGAZINE(ギガジン) (@gigazine) May 21, 2023

・国内初の運転者いない自動運転「レベル4」、福井で移動サービス開始
なにいいい！
実家帰らねば

・自然言語処理AIによる国会答弁作成支援システムを開発
-質問に関連した議事録を選び出し、その情報と共にGPTへ質問を入力するという手法によって信頼性の高い回答を得る
-回答根拠の議事録文章も表示
-答弁内容をより正確に理解することが可能

・喪失感埋まる？ただの"電子人形"？　中国で賛否「バーチャル故人」AIとCG駆使、ビデオ通話もOK（西日本新聞） - Yahoo!ニュース

すげーなこれ。「違う…◯◯なら決してそんな事は言わない…お前は…お前は◯◯じゃない…！」を素でできる時代が来たぞ。

喪失感埋まる？ただの"電子人形"？　中国で賛否「バーチャル故人」AIとCG駆使、ビデオ通話もOK（西日本新聞） - Yahoo!ニュース https://t.co/U58VE8SUtd
— おぐ🔞大健全神 (@Shizzko_Takio) May 22, 2023

・人気ホストの声を使ってAI生成のポッドキャスト広告を作成する方法を開発中だそう

・ヤバすぎる
wonder studioとかなんかな
何はともあれ、すごい世界観

見て！！Vtuberだけどバーチャルの壁超えてリアルに干渉できるようになりました！！これでリアルの大道芸人と一緒にジャグリングコラボもできちゃう！！ほかにも色々できそう！めっちゃ夢広がる！！ pic.twitter.com/L403M3GnYD
— 三珠さくまる🤹Vtuber技術無駄遣い&ジャグリングVtuber (@MitamaSakumaru) May 23, 2023

・ アドビがPhotoshopにFirefly搭載。これは動画見ると流石にびびる。

アドビがPhotoshopにFirefly搭載。これは動画見ると流石にびびる。 pic.twitter.com/vqmlzhFbM3
— Munechika Nishida (@mnishi41) May 23, 2023

・年内で10万人のデジタルヒューマン

【本日の注目記事】
シャオアイスがGPTデジタルヒューマンプログラムを計画。3~5分の動画やSNS情報に基づいてデジタルヒューマンを生成し、300人から始まり年内に10万人まで増やすという。実は半年前に開発され、GPTカテゴリのアプリダウンロード数では日本一になっている。 https://t.co/ulEHKCQZBW
— 36Kr Japan@中国NO.1テック・スタートアップ専門メディア (@36krJ) May 23, 2023

・MicrosoftがCopilotをAIアシスタントとしてWindows 11に導入

MicrosoftがCopilotをAIアシスタントとしてWindows 11に導入。

PC内でアクションを行えるAI、そしてファイル・アプリにアクセス出来るAIになる。

この展開はOff Topicの最近のエピソードでも話していた展開で、AIが新しいOSレイヤーになり得る。https://t.co/X8aB6gglE1 pic.twitter.com/fMxlU614EV
— Tetsuro Miyatake (@tmiyatake1) May 23, 2023

・#ChatGPT に #Bing の検索エンジンがデフォルトで導入

今日から、#ChatGPT に #Bing の検索エンジンがデフォルトで導入されます。
これで、検索失敗ばかりで使えなかったChatGPTのブラウジングが大幅に改善されるはず。https://t.co/TTkXhkub4o pic.twitter.com/xUqfmlxa25
— IT navi (@itnavi2022) May 23, 2023

・ バーチャルAI先生の@TiimoAI(ティーモ)の先行予約を開始

バーチャルAI先生の@TiimoAI(ティーモ)の先行予約を開始しました🎉

ティーモはChatGPTを導入したバーチャルAI先生で
・個別最適化された授業
・進捗や成績の記録
・質問回答
をすることができます

予約登録やデモは以下コメントのリンクから👇 pic.twitter.com/SagCVtxVIc
— 叡佑/Eisuke (@asuke_rug) May 24, 2023

・Azure OpenAI Serviceのアップデート詳細

更にAzure OpenAI Serviceのアップデート詳細はこちらにも。個人的にはChatGPTのスループットユニットの指定でChatGPTのパフォーマンスが制御できるProvisioned Throughput SKUと、カスタマイズ可能になったコンテンツフィルタが地味に嬉しい。事例も多数発表。…
— Hirosato Gamo | AI Cloud Solution Architect (@hiro_gamo) May 23, 2023

・Microsoft CEO Satyaによる先行発表

Microsoft CEO Satyaによる先行発表。
詳細はBuildイベントで発表されるけど、かなり情報を先に公開したみたい。ざっくり下記↓
・ChatGPTのPlugin PlatformがBing Chatと共有される
・Microsoft365、Azure OpenAI ServiceでもPlugin導入
・Azure OpenAI ServiceはProvisioned Throughput… https://t.co/RDIn9olV4a
— Hirosato Gamo | AI Cloud Solution Architect (@hiro_gamo) May 23, 2023

・ Google Bardでは画像をGoogle検索から引っ張ってくる機能がローンチ

Google Bardでは画像をGoogle検索から引っ張ってくる機能がローンチ。

テキストとビジュアルを組み合わせた回答をしながら、画像のソース元を記載。https://t.co/yES8fwnetM pic.twitter.com/KpsUQ6froG
— Tetsuro Miyatake (@tmiyatake1) May 24, 2023

・Novel AIの新しい言語モデル: Clio がリリース

Novel AIの新しい言語モデル: Clio がリリースされてる！
なお、Opusユーザー限定です。なお、今まで通りGenji (GPT-J 6Bの日本語特化のfine-tuning) はOpusユーザー以外も使えます。
下のほうに日本語でのリリース文もあります。https://t.co/B28kV03T8l
— 逆瀬川 (@gyakuse) May 23, 2023

・［速報］マイクロソフト
ChatGPTとCopilotのプラグイン共通化を発表。プラットフォーム化とエコシステムを促進。Build 2023 － Publickey

・MS、Webサイト構築の手間を省くAIツールを発表
-ローコードサイト作成ツール「Power Pages」用の「Copilot in Power Pages」の米国向けプレビュー版提供開始
-テキスト、フォーム、チャットボット、レイアウトを生成し、画像やサイトデザインのテーマを作成・編集が可能

・MS、新しいE2Eのデータおよび分析プラットフォーム「Microsoft Fabric」を発表
-OneLakeデータレイクを中心に、S3やGCP(間も無く)からもデータを取り込むことが可能
-改良されたPower BIによる、使いやすい可視化とAIベースの分析ツールも
-AI Copilotも統合予定

・MS、AIが生成した画像や動画に電子透かしを入れることを約束
-MSのCanvaのようなWebアプリ、Bing Image Creator、Designer向けに新しいメディア証明機能を開始
-画像や動画がAI生成かどうかを消費者が検証可能に
-今後数カ月で展開予定

・MS、ChatGPTプラグイン規格と同じものを採用と発表
-Bing Chat、Dynamics 365 Copilot、Microsoft 365 Copilot、Windows Copilotで動作するプラグインを構築可能
-プラグインは、AIにプライベートファイルへのアクセスを提供し、ビジネスデータに関するQAなども可能に

・MS、Teamsエンタープライズカスタマーにアバターを提供
-今週からMicrosoft 365 BusinessとEnterpriseの全ライセンスで、WindowsとMacのTeamsデスクトップアプリでアバターが一般利用可能に

・MS、テキストや画像をモデレートする新しいAIツールAzure AI Content Safetyを発表
-Azureを通じて提供
-画像やテキストに含まれる不適切コンテンツを検出するために訓練された様々なAIモデルを提供
-日本語も理解

・Windows Copilot：Bingチャット体験をWindows 11に組み込み
-タスクバーの右側に用意される新しいWindows Copilot
-設定を簡単に変更
-クリップボードからコンテンツを要約
-さまざまなQA
-プラグインでさらに強化
などなど
新しいBingのWindows 11への統合は、6月予定

・MS、独自のAI copilotを構築可能にするAzure AI Studioを発表
-GPT-4のようなモデルと自社データを組み合わせ、プライベートデータを利用したAIチャットやその他のアプリを構築可能
-プラグインで拡張し、サードパーティーデータやその他サービスへのアクセスも可能に

・Google、AIチャット表示広告の実験を開始予定

・Google検索広告は、生成AIでクエリに自動適応するように
-生成AIを利用し、クエリに基づいて検索広告をより効果的に作成
-LPや既存広告コンテンツなどを利用し生成
-例：「乾燥性敏感肌用スキンケア」と検索した時、LPなどを利用し「乾燥性敏感肌を癒す」など、クエリと関連する見出しを作成…

・Googleがやってきた
Google、生成AIで商材画像を作成できるツール「Product Studio」を導入
-新たな写真撮影の追加コストをかけずに、新しい画像を作成可能
-邪魔な背景削除も可能
-米国の加盟店は、今後数ヶ月のうちに利用可能に

・Cognitive Searchのベクトルサーチ対応も発表

https://t.co/qSDckTB1Kp
こっちには日本語で纏まってた！
Cognitive Searchのベクトルサーチ対応も発表！
うれしい！あとMicrosoft FabricもBigQuery以来のデータ基盤のゲームチェンジャーになる気がしている。
— Hirosato Gamo | AI Cloud Solution Architect (@hiro_gamo) May 23, 2023

・無料！？金持ってんなー
楽天、Rakuten ViberでOpenAI社の対話型・画像生成AIを無料で利用可能に
-楽天グループのViber Media S.a.r.l.が提供するメッセージングアプリ「Rakuten Viber」にて
-ChatGPTや、DALL-E2を無料で利用できる「Viber AIチャット」の提供を開始

・Github Copilotの最新のデモ

Github Copilotの最新のデモで、同僚が書いた意味不明なコードを引き継いだ際に、その意味不明なコードが何やってるかCopilotに解説させ、もっと分かりやすいコードに変換するというのをやってる

これで既にいない前任者が残した謎のコードに苦しめられてるエンジニアが一気に救われるのではないか笑 pic.twitter.com/5OHHatyFzc
— KAJI | 梶谷健人 (@kajikent) May 24, 2023

・DeepL翻訳の日本語版に「敬体・常体の切り替え」機能が搭載

DeepLからリリース。DeepL翻訳の日本語版に「敬体・常体の切り替え」機能が搭載に。切り替えで当然、翻訳される文章の印象は変わるので、ビジネス向けなどで使い分けを。 pic.twitter.com/o0YgrBZvDu
— Munechika Nishida (@mnishi41) May 24, 2023

・やってけやってけ
アサヒ『ジェネレーティブAI 「やってTRY」プロジェクト』発足業務効率化や潜在ニーズ掘り起こしへ
-グループ各社より自薦で約100名の社員が参加
-生成AI関連の商用サービスを用いて、社内業務への有効な適用や効果創出の可能性を評価

・ Microsoft Bingの画像生成、ロゴやアイコンのデザイン案出しに凄く良い。

Microsoft Bingの画像生成、ロゴやアイコンのデザイン案出しに凄く良い。 pic.twitter.com/viVZRvcHuU
— けんじ / UX Designer (@kenji_clown5) May 23, 2023

・チャットボットスタートアップのhttps://t.co/z5kpHFhYnLのモバイルアプリがリリース！
2ヶ月前1億、先月1.7億MV、滞在時間も平均約30分と伸びてる中でのさらにスマホアプリ
ios: https://t.co/czpUTHc0Ey
android: https://t.co/yApbHdgcCn
記事: https://t.co/Bfxj9VotrR

・GPT-4による新しい電話アシスタント
チャットしたり、保留時の番号押すなどを代行し、アメリカの内国歳入庁の適切な部門を見つけ、通話をユーザーに繋げてくれる
今週、アルファ版の@DoNotPayユーザーに展開
全般で欲しい。
xxxの時はy番を押してください、とか保留待ち時間ほど無駄な時間ない。

Here is GPT-4 chatting with the IRS to skip waiting on hold, navigate the phone tree, find the right department and transfer the call to the user.

We have built a new Consumer Rights Phone Assistant to save people time. Rolling out to all @DoNotPay users in alpha this week pic.twitter.com/aLak9ZKrOh
— Joshua Browder (@jbrowder1) May 23, 2023

・【国内初】株式会社Trippy、『けものフレンズ』公式のAIチャットサービス

お知らせなのだ！『けものフレンズ』公式のAIチャットサービス、「AIアライさん」が国内初リリースなのだ～！ AIアライさんはあなたのおしゃべり相手なのだ！

【国内初】株式会社Trippy、『けものフレンズ』公式のAIチャットサービス「AIアライさん」をリリース https://t.co/F6JZk26brq @PRTIMES_JP
— AIアライさん (@ai_araisan) May 25, 2023

・AI にテイラーのチケットを監視させて、入手可能になったら購入するよう依頼してるw
いい。
次の井上尚弥のチケット争奪戦でやってみよかな、これ

I've discovered an incredible use-case for Personal Assistant.

My sister has been dying to get Taylor Swift tickets, but can't pay resale prices.

So I asked the AI to watch for the tickets and buy them once they're available :) pic.twitter.com/io5uhUJLPo
— Matt Shumer (@mattshumer_) May 24, 2023

・KDDIが安全なAIチャット環境を構築
KDDI AI Chat
中身なんやろ
>ＫＤＤＩ独自の環境を構築して利用するため、秘匿情報が外部に流出しないことが担保され、安心安全にＡＩを利用できる環境を構築

ＫＤＤＩ、社員１万人が「ＫＤＤＩ　ＡＩ－Ｃｈａｔ」の利用を開始 | 株式投資情報　総合　日本インタビュ新聞 https://t.co/RZZofClxRq
— AI 人工知能ニュース (@ai_news_jp) May 25, 2023

・ジェネレーティブ塗りつぶし機能の商用利用不可ソース

ジェネレーティブ塗りつぶし機能が商用利用不可のソースはこちらですね。
adobeのブログです。

adobeの日本語ページは全体的に商用利用可能アピールすごくて誤解するhttps://t.co/m7EJLyR7Eq https://t.co/Vn2VvnJZpT pic.twitter.com/GQJA79O5cK
— Kakko🌸🌈AI漫画 (@kakowara365) May 25, 2023

・東京都、スマート書記導入

東京都にスマート書記が導入されました！しっかりと使っていただけるように、プロダクトの改善を行っていきます！https://t.co/ubcmzfdxM7
— Takayoshi Matsuda⛳Epicbase, Inc. (@takayoshi_mats) May 25, 2023

・Azure OpenAI ServiceとAzure Machine Learningの影響力

Azure OpenAI Serviceはクラウド業界の勢力図をぶっ壊すレベルのキラーコンテンツだというのは推進者として感じるけど、いま何を一番Azureで勧めたいかと聞かれるとAzure Machine Learningと言ってしまうくらいにはアツい。…
— Hirosato Gamo | AI Cloud Solution Architect (@hiro_gamo) May 25, 2023

・現実とデジタルの境界の融合
現実とデジタルの境界がますます溶けていく

写真から何でも瞬時にアバターに変換できるアプリを作り始めた。AVATAVIアプリと連携して現実空間内で動かしたりもできる！ Working on a "turn anything into avatar" app that works with @AVATAVI_app to move it in the real world. pic.twitter.com/bLRag0QkLO
— Takahiro Poly Horikawa 堀川隆弘 (@thorikawa) May 25, 2023

・ StabilityAIのClipdropが画像バリエーション生成を簡単に提供

StabilityAIから誰でも画像からバリエーション生成できる“clipdrop”が使えるようになっとるぅ！

使い方は画像を選択してアップロードするだけだ。

サイトからデモで使ってみたが早い！
(イラストはお勧めしない)

トライ↓
🔗 https://t.co/BpOQ1YVqAh pic.twitter.com/bYP5ITV1TP https://t.co/FJMOHjzJXK
— しょーてぃー / Experience Designer & Prompt Designer (@shoty_k2) May 25, 2023

・ ChatbotアリーナのリーダーボードにGooglePaLM2とclaudeが追加
Chatbotアリーナのリーダーボード更新
GooglePaLM2、claudeなども追加
claude強い

⚔️Chatbot Arena Leaderboard Update!

Exciting to welcome new entrants:
- Google PaLM 2
- Claude-instant-v1
- MosaicML MPT-7B

The competition is heating up🔥 Check out our analysis for all the surprising results at https://t.co/v9NOY3k9ql

Remember, your vote shapes the arena.… pic.twitter.com/NklFP9d3wt
— lmsys.org (@lmsysorg) May 25, 2023

・ Google、AI検索実験を開始
GoogleがAI検索の実験開始
Search Labsのwaiting listを突破した人が検証可能
Search Generative Experienceという、Google全体の検索結果のトップにAI生成要約を表示、など
記事: https://t.co/5cwKeQ6ED2 https://t.co/ImrpUmKwqK

・ Smart NPCsプラグイン、リアルタイム音声会話を実現

NPCとのリアルタイム音声会話を可能にする「Smart NPCs」発表！AIを利用したUnreal Engine向けプラグイン #SmartNews https://t.co/MrE6BBssGb
— shi3z (@shi3z) May 26, 2023

・ ChatGPTのデフォルト検索エンジンがBingに変更
知らなんだ
ChatGPTのデフォルト検索エンジンは「Bing」にーー課金ユーザーから提供開始 https://t.co/Df1pM9Vgoq @thebridge_jpより

・アイリスオーヤマ、AI対話エンジン「PKSHA Chatbot」を導入
アイリスオーヤマ、PKSHA WorkplaceのAI対話エンジン「PKSHA Chatbot」を導入
-Slack上で活用が可能なAI対話エンジン
-人事・経理等の質問等、バックオフィス部門や関係各所への問合せ対応に対する課題の解決

・米軍のロボット戦闘車計画、Scale AIを採用
@scale_AI が、陸軍内の主要な自律プログラムである米軍のロボット戦闘車計画に採用される

.@scale_AI has been chosen by the U.S. Army to support the Robotic Combat Vehicle (RCV) program, one of the major autonomy programs within Army.

Ground autonomy is a key capability for the DoD as we look towards the Army of 2030 or 2040, and we must win.https://t.co/lpqfa9q7q0
— Alexandr Wang (@alexandr_wang) May 26, 2023

研究開発

・PaLM 2のテクニカルレポートが出てた
論文: https://t.co/VZrT8JGU1K https://t.co/dx9iMxUvuc

PaLM 2 Technical Report

paper page: https://t.co/MXqCy1lPZO pic.twitter.com/8SNQyF0Djn
— AK (@_akhaliq) May 18, 2023

・ジェネレーティブエージェント論文のバーチャル世界を実装したリポジトリ

ほ！？ジェネレーティブエージェント論文のバーチャル世界を実装したリポジトリが登場したらしい！　　　https://t.co/fEsPz6w6ZZ
— うみゆき@AI研究 (@umiyuki_ai) May 18, 2023

・LangchainとMSのGuidanceを使われた方の両者比較
詳細は元投稿スレッド

I have spent hours using Guidance, so you don't have to.
tl;dr
- Guidance template code is simple & clean
- Guidance supports local LLMs
- Guidance has Agents and Tools support
- Guidance is less opinionated

🧵👇 more comparisons and learning in the thread https://t.co/I0Wnb5zRme
— Shaun.AGI (@agishaun) May 18, 2023

・Meta、Copilotに似たコード生成AIモデルCodeComposeを構築
-まだ一般には未公開
-VS CodeのようなIDEで入力すると、Pythonや他の言語のコード候補が表示
-基礎となるモデルは、Metaの公開研究の上に構築-複数のCodeComposeモデルのうち最大は67億のパラメータ

・Metaが世界最速クラスのAIスーパーコンピュータの1つを構築完了

今日、Metaが世界最速クラスのAIスーパーコンピュータの1つを構築完了したと報告。AI研究がさらに加速。フル稼働時には約5エクサフロップスの計算能力を実現とのこと(1秒あたり5 × 10^18回の計算。これは1秒あたり1回計算するなら158,443,825,000年かかる(約1580億年かかる）https://t.co/Cl85ZIEOAA
— 小猫遊りょう（たかにゃし・りょう） (@jaguring1) May 19, 2023

・Drag Your GAN
-GAN生成の画像を対話的に操作し、潜在空間を直接編集
プロジェクト：https://t.co/A543irDT4f https://t.co/m5UPgMnMO6

Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold

paper page: https://t.co/Gjcm1smqfl pic.twitter.com/XHQIiMdYOA
— AK (@_akhaliq) May 19, 2023

・GETMusic
ミュージシャン向けの様々な用途の音楽copilot
任意の音楽トラック (665 タスク) を生成可能
音楽生成のようなミュージシャンの代替ではなく、音楽スコアでサポートをする
論文: https://t.co/4Ss0WhA8eY
プロジェクト: https://t.co/YX5tZBdZ9G https://t.co/QJ1sPAU0A5

GETMusic, a versatile music copilot for musicians!

1. Generate any music track (665 tasks) using a universal diffusion framework.
2. Empower musicians with music scores, instead of replacing musicians as in music audio generation.

Code will be here: https://t.co/ZSZDLMn1Ck https://t.co/PHZHGIMRgH
— Xu Tan (@xutan_tx) May 19, 2023

・LLM Meetup Tokyo #2 のまとめ記事

早速5/18 LLM Meetup Tokyo #2 のまとめ記事を書きました！いったんTwitterで共有頂いているものだけ掲載していますが、個別に確認が取れ次第で更新していきます。スライド数が狂気。

LLM Meetup Tokyo #2 開催レポ＆LTまとめ｜mah_lab / 西見公宏 #note #LLMMeetupTokyo https://t.co/gYEpbIgCMh
— mah_lab / Masahiro Nishimi (@mah_lab) May 19, 2023

・CyberAgent社の日本語LLM OpenCALMを対話モデル用途にdollyデータセットでLoRAチューニングしたブログ記事

CyberAgent社の日本語LLM OpenCALMを対話モデル用途にdollyデータセットでLoRAチューニングしたブログ記事を公開しました！既存の公開モデルに対してクオリティの高い生成もできているので是非御覧ください！https://t.co/Bo6nmxc8qm
— せいしん | ACES, Inc. (@seishin55) May 19, 2023

・SQUARE ENIXのAI部から三宅陽一郎を筆頭に、現役のゲームAI技術者によるAI関連の技術や話題の解説するページ

https://t.co/LMVvcUK8H2
SQUARE ENIXのAI部から三宅陽一郎を筆頭に、現役のゲームAI技術者によるAI関連の技術や話題の解説するページのご紹介です。
近年話題の自然言語処理や画像生成に代表される生成系AIや、ディープラーニング、状況予測と意思決定システムなど、幅広い話題を取り扱っていきます。
— SQUARE ENIX 採用公式＠SQEX_RECRUIT (@SQEX_RECRUIT) May 19, 2023

・実験結果を雑にまとめました
rinna 3Bをcppで動かす｜if001 @if_004 #note

実験結果を雑にまとめました

rinna 3Bをcppで動かす｜if001 @if_004 #note https://t.co/vJlGLCWb9c
— いふ (@if_004) May 19, 2023

・Chat with NeRF
NeRFの3Dモデルを入力にLLMでチャットできる

📸 Chat with NeRF

NeRFの3Dモデルを入力にLLMでチャットできる
🔧https://t.co/xv3jWlKx0R

LERF(https://t.co/pwWByeSTDi)使って3Dモデルを自然言語で説明可能にして、GPT-4で対話！
(LLaVA＋BLIP-2とかも開発中)

iPhoneでNeRFスキャンした物体を質問できるね！
デモの部屋、ドア多すぎて間違う笑 pic.twitter.com/7pH8GWZ7Qz
— forasteran (@forasteran) May 21, 2023

・スーパーコンピュータ「富岳」（以下、「富岳」という）を活用した大規模言語モデル（Large Language Model, LLM）[用語1]の分散並列学習手法の研究開発

東京工業大学、東北大学、富士通株式会社、理化学研究所は、「富岳」政策対応枠において、スーパーコンピュータ「富岳」（以下、「富岳」という）を活用した大規模言語モデル（Large Language Model, LLM）[用語1]の分散並列学習手法の研究開発を2023年5月から実施します。https://t.co/ORj159y4xc
— Satoshi Matsuoka (@ProfMatsuoka) May 22, 2023

目標としては、GPT3.x並みの1700憶パラメタのモデルを富岳の1/5程度を使って一月程度で事前学習モデルを形成します。勿論、富岳ではその為に多くの高速化の技術を既に開発中で、それらの技術は今後の各機関の学習専用スパコンやFugakuNEXTなどに活かされるでしょう。
— Satoshi Matsuoka (@ProfMatsuoka) May 22, 2023

今回重要なのは、1. 実際に日本語や日本の知識を重視した特定の大規模公開モデルが作成されるだけではなく、2. それを実際に形成する高度学習の研究や技術を日本が獲得し、3. それらを用いて種々の研究開発や民間の個別データに特化したモデルを構築する礎とすることです。
— Satoshi Matsuoka (@ProfMatsuoka) May 22, 2023

・大規模LLMのFine Tuning はデータ量よりデータの質が鍵とする論文

大規模LLMのFine Tuning はデータ量よりデータの質が鍵とする論文。65BのLLaMaモデルを1000件の厳選したサンプルで学習することでGPT-4と比較して人間が選好/同等とする割合が43%、またGPT-3ベースのdaVinci003では65%と勝ち越す。事前学習で必要な知識は獲得済みの示唆
https://t.co/esPJyWdU73
— piqcy (@icoxfog417) May 22, 2023

・Any2Anyの拡散モデル

いずれ出てくると思ったけど、Any2Anyの拡散モデルが提案されたみたい。言語、画像、動画、音声の任意の組み合わせ（訓練データになかったものでさえ）から、任意の組み合わせを出力できる。単一モダリティのSOTAとすら並んだり凌駕する（画像はImagenとかと比べてないけど）https://t.co/SeUXA8KLye
— はまなすなぎさ (@RosaRugosaBeach) May 22, 2023

・CRITIC：ツールインタラクティブな批評で自己修正可能なLLM
-出力に対し、外部ツールと連携して批評を生成、出力を検証
-フィードバックに基づいて出力を修正
-質問応答、プログラムの合成を含む評価により、性能向上を実証
github: https://t.co/p4p8H3wYgB
論文: https://t.co/s0Cd6hqAJT https://t.co/ZKjPenZpJT

・Chupa：拡散モデルを用いてリアルなデジタルアバターを生成する3D生成パイプラインの提案
論文: https://t.co/nl8kqzwy1E

・ドメイン特化の質問応答のパフォーマンスを向上
-MSQA というMSの技術的問題に関するベンチマークQA データセットを提供
-以下を評価
Expert: MSQAチューニングのドメイン特化LLaMaモデル
LLM: ノーマルGPT
+BM25: いわゆる検索拡張 +Expert: Expertの回答をGPTのプロンプトに追加 +BM25 & Expert: 検索情報とExpertの回答両方の組み合わせをプロンプトに追加

・脳活動から人間の視覚を復元
大脳皮質のfMRI データから任意のフレームレートの高品質な動画を生成するMind-Video を提案
論文: https://t.co/f2f9KYAA8u

Cinematic Mindscapes: High-quality Video Reconstruction from Brain Activity

propose Mind-Video that learns spatiotemporal information from continuous fMRI data of the cerebral cortex progressively through masked brain modeling, multimodal contrastive learning with spatiotemporal… pic.twitter.com/ExIWGvKis6
— AK (@_akhaliq) May 22, 2023

・scikit-learnならぬscikit-llm
ChatGPTのような言語モデルをscikit-learnにシームレスに統合し、テキスト分析タスクを強化

・Weights & Biasesに来てから初のブログです。wandbのHugging FaceやLangChainとの連携の紹介などです。

Weights & Biasesに来てから初のブログです。wandbのHugging FaceやLangChainとの連携の紹介などです。https://t.co/zOmQ7tQ8W1
— ねじゅみ (@nejumi_dqx) May 22, 2023

・言語モデル（LM）が意味を理解しているのかを調べる

言語モデル（LM）が意味を理解しているのかを調べるため、プログラムに対するLMを構築し、LMの内部状態からプログラムの意味を推定する実験をした結果、単語予測精度と意味推定精度の改善ペースがほぼ一致し、またLMが将来に何を生成するかを考えていることもわかった。https://t.co/r3olHpjoMr
— Daisuke Okanohara / 岡野原大輔 (@hillbig) May 21, 2023

・#ControlVideo

#ControlVideo ControlNet派生で凄そう

txt2videoの寵児なるか
フレーム間の外観の一貫性
フリッカー効果軽減(フレーム補間)
短クリップを別々に合成する階層型サンプラで全体的な一貫性保持

📃https://t.co/dP1yTjcZo0
今週あたりにコード公開
🔧https://t.co/qENC0jrvTI https://t.co/XDBfrsaE5H pic.twitter.com/lNnpevmOPJ
— forasteran (@forasteran) May 23, 2023

・RWKVの論文
Transformerの効率的な並列化可能な学習とRNNの効率的な推論を組み合わせた新しいモデルアーキテクチャ、Receptance Weighted Key Value（RWKV）を提案

#RWKV: Reinventing RNNs for the Transformer Era https://t.co/jVA4aKTtjW https://t.co/q7HN2Ejhaj pic.twitter.com/7t6FQBSkuX
— BlinkDL (@BlinkDL_AI) May 23, 2023

・RNNの再帰機構をシミュレートし言語ベースの長期・短期記憶を更新する「RecurrentGPT」
-自然言語記憶を人間が観察・編集可能
-読者と直接対話する対話型小説の可能性を示唆
論文: https://t.co/aKRgzmKaw5
github: https://t.co/Yj8O4in9dN
対話的生成デモ: https://t.co/sxhI9IjzjE https://t.co/PEutK3Fu7Q

RecurrentGPT: Interactive Generation of (Arbitrarily) Long Text

RecurrentGPT, a language-based simulacrum of the recurrence mechanism in RNNs. RecurrentGPT is built upon a large language model (LLM) such as ChatGPT and uses natural language to simulate the Long Short-Term Memory… pic.twitter.com/tTMqgCUq0i
— AK (@_akhaliq) May 23, 2023

・TWIST
-MetaAI, ヘブライ大学, OpenAIより
-学習済み言語モデルからウォームスタートでSpeechLMを訓練する方法であるTWISTの提案
-コールドスタートのSpeechLMを全面的に凌駕
プロジェクト: https://t.co/PwQoZ4MZv8
論文: https://t.co/zDdud64lKc https://t.co/3JjmmdI0Ec

Textually Pretrained Speech Language Models

Presents the largest SpeechLM both in terms of number of parameters and training data.

proj: https://t.co/LJMxUpKBAc
abs: https://t.co/AVatnqTohP pic.twitter.com/lbJR2A5bGe
— Aran Komatsuzaki (@arankomatsuzaki) May 23, 2023

・幅広い言語をカバーするMassively Multilingual Speech（MMS）プロジェクト
-wav2vec 2.0と、1100以上言語のラベル付きデータ、約4000言語のラベルなしデータの組み合わせ
-Tatuyo語など、数百人しか話者のいない言語も含む
-既存モデルより10倍の言語をカバー

・Rinnaのチャットモデルとお話する方法、まとめた

Rinnaのチャットモデルとお話する方法、まとめたhttps://t.co/p5hDyLdQ8C
— きしだൠ(K1S) (@kis) May 22, 2023

・RedPajama 3B が iPhone 上で動作

RedPajama 3B now runs on an iPhone!

... or on AMD, Nvidia, Intel GPUs, Apple Silicon, iPhones, and Android phones.
Excited by the possibilities this opens up for personal, private LLMs trained and running on your local device! #opensourceai #mlcllm https://t.co/FzLeiHNIvw pic.twitter.com/xZYnsu7NmC
— Together (@togethercompute) May 22, 2023

・日本語LLM向けチャットデータセット(約840万件)，LLaMAのチューニングモデル，論文を公開

日本語LLM向けチャットデータセット(約840万件)，LLaMAのチューニングモデル，論文を公開しました！

詳細についてはこちら↓https://t.co/uqrYu6DXiA

(貧弱なbackendですが)遊んでもらうこともできます！https://t.co/MOSlrZDUgS

論文：https://t.co/JDZwsvEatU

詳細はスレッドにぶらさげます
— Masanori HIRANO (@_mhirano) May 23, 2023

・Google Colab で OpenCALM-7B のLoRAファインチューニングを試す｜npaka @npaka123 #note

Google Colab で OpenCALM-7B のLoRAファインチューニングを試す｜npaka @npaka123 #note https://t.co/Kfinw7bcwh
— 布留川英一 / Hidekazu Furukawa (@npaka123) May 23, 2023

・インテル、1兆個のパラメーターを持つ科学向けの生成AI「Aurora genAI」を発表
-2エクサフロップスのAuroraスーパーコンピュータを利用しAurora genAIを動かす予定
-一般テキスト、科学テキスト、科学データ、およびドメインに関連するコードで学習させる予定

・LangChainとguidanceの使い方

LangChainとguidanceの使い方をｶﾞｯとまとめました！
最近Microsoftから出たguidance、ﾒﾁｬ便利なのでオススメです！https://t.co/haAYUbys5P
— 逆瀬川 (@gyakuse) May 24, 2023

・Control-A-Video：拡散モデルによる制御可能なテキスト動画生成
-エッジやデプス、テキストで制御可能
プロジェクト: https://t.co/klojIF6eN6
論文: https://t.co/TM2MmcctBf https://t.co/k1Wxt2BnUq

Control-A-Video: Controllable Text-to-Video Generation with Diffusion Models

proj: https://t.co/RnK17xMhd6
abs: https://t.co/ovTQ299lqI pic.twitter.com/ou1oqAysgy
— Aran Komatsuzaki (@arankomatsuzaki) May 24, 2023

・Anthropic Claude-V1が自前AWSで

Anthropic Claude-V1が自前AWSで動いてる！これは良いね〜

高精度な生成系 AI アプリケーションを Amazon Kendra、LangChain、大規模言語モデルを使って作る
by 関谷侑希 | on 16 5月 2023 https://t.co/eesOlb9MIf
— Dr.(Shirai)Hakase #AI神絵師本 #技術書典14 (@o_ob) May 24, 2023

・CyberAgent AI事業本部MLOps研修応用編

この研修資料凄いですね。これあればAI使ったサービス立ち上げられそうな気すらします > CyberAgent AI事業本部MLOps研修応用編 https://t.co/u7G70cLWze
— からあげ (@karaage0703) May 24, 2023

・QLoRA

QLoRA凄そう！https://t.co/Fi8lVqzkQu
4ビット量子化でメモリ使用量削減でLLaMA 65Bを単一GPUの48GB VRAMで微調整でき
Guanaco 33Bと65BがChatGPTに勝つるｗ

ｸﾞｱﾅｺ13BでもBardに優り
7B/13BならColabで動くだと🫢

LLaMA 65Bを16-bitで微調整にはVRAM780GB必要だったhttps://t.co/23MuSYE3I7 pic.twitter.com/R31L5rmbyq
— forasteran (@forasteran) May 25, 2023

・人間による評価をシミュレートすることで高速＆安価にチャットAIの学習を進められるツール「AlpacaFarm」
がスタンフォード大学のチームによって作成される #SmartNews

・ #ProFusion

#ProFusion やばそう
🔧https://t.co/AiZp7I2Vaz

１枚の画像から(正則化フリーで)特徴を覚えてモデルを微調整できる奴
(UB🐃とAdobe研)

DreamBoothは正則化使っててクラスとかも教えないといけなかった

事前トレーニングはやってくれてて、20GBのVRAMあれば１枚画のファインチューニングできるの！ pic.twitter.com/1vVZwcekBi
— forasteran (@forasteran) May 25, 2023

・LayoutGPT：LLMによる視覚的なレイアウト計画および生成
-テキストから画像への変換モデル/システムを20～40%上回る
-数値的・空間的に正しいレイアウトを設計する際に人間と同等
-3D室内シーン生成において、教師あり手法と同等の性能を達成
サービスに落ちてくるのはもう少し先かな…

LayoutGPT: Compositional Visual Planning and Generation with Large Language Models

Outperforms text-to-image models/systems by 20-40% and achieves comparable performance as human users in designing visual layouts for numerical and spatial correctness.https://t.co/RJaN4Fp914 pic.twitter.com/yGsV674J6h
— Aran Komatsuzaki (@arankomatsuzaki) May 25, 2023

・LLMで世界モデルと推論エージェントの２つを作り、世界モデルにガイドさせる事で、推論性能が上がりましたよと
各ドメイン世界モデルとドメイン特化推論エージェントとの相互作用で色々変わってくるんやろうか

Repurposing LLMs As Both World Model & Reasoning Agent

-LLM (as agent) incrementally builds a reasoning tree under guidance of LLM (as world model)
-High rewards balancing exploration vs. exploitation

-W/ this, LLaMA-33B beats GPT-4 by 33% in planninghttps://t.co/ekhRCTqwVn pic.twitter.com/m3Jn3w7CMl
— John Nay (@johnjnay) May 25, 2023

・視覚言語モデルによる動画説明生成で検索体験の向上
Youtubeショートは説明文や役に立つタイトルが含まれていないことが多いから、検索で見つけにくい
これに対し、視覚言語モデルFlamingoを使い、動画の最初のフレームを分析して、何が起こっているのかの説明を生成。
検索しやすさを向上。

Our powerful visual language model Flamingo is changing the way 𝘺𝘰𝘶 can watch @YouTube Shorts. 🦩

It automatically generates descriptions for hundreds of millions of videos in their metadata, making them more searchable.

Here’s how AI is helping creators and viewers. ⬇️ pic.twitter.com/pAt7MxFNs1
— Google DeepMind (@DeepMind) May 24, 2023

・これはもうデザイナーやレタッチャー大勝利では？またゲームチェンジが起きてしまった。

これはもうデザイナーやレタッチャー大勝利では？またゲームチェンジが起きてしまった。
👇だいたいこんな感じで指定してます。背景を変えたり、ちょっと足し引きしたりするのは得意。人間は苦手です。顔も手も全然ダメでした。 https://t.co/YNvEBBesut pic.twitter.com/Wlm4pemSVQ
— はせ@AI Photo (@hases0110) May 24, 2023

・Azure Machine Learning入門書の紹介

同僚が死ぬ気で書いたAzure Machine Learningの入門書(表紙がかわいい)https://t.co/7KWixSJ1Lm
— Hirosato Gamo | AI Cloud Solution Architect (@hiro_gamo) May 25, 2023

・OpenCALM-7BをLoRAでFine tuningし対話可能にする方法

「OpenCALM-7BをLoRAでFine tuningして対話ができるようにする」をやっと書きました！
PEFTを使ってLoRAを作る方法です。データセットさえあれば色々できそう。
要約データセットとかもあるから誰か試してみてもらえないかな？https://t.co/0yD1JMweDQ
— masuidrive (@masuidrive) May 25, 2023

・ OpenAI Cookbookに追加されたプロンプト関連のライブラリと論文のリスト

Jotted down a list of some interesting prompting libraries and prompting papers in a new section of the OpenAI Cookbook.

Any ones you like that we're still missing?https://t.co/sd4vINuZbo
— Ted Sanders (@sandersted) May 24, 2023

・ Alexandria - オープンソース埋め込みデータセットイニシアチブ
ネットを埋め込むオープンソースイニシアチブAlexandria
-オープンな埋め込みデータセット (研究、法律、金融など) がないため組織を構築
-まず、Arxiv 上のすべての研究論文の埋め込み
Arxiv 埋め込み (タイトルと要約) : https://t.co/g53FeJ5vK9
組織に関して: https://t.co/dh2WwQuFgO https://t.co/MTuposjD7Q

Today, I'm announcing Alexandria, an open-source initiative to embed the internet.

To start, we're releasing the embeddings for every research paper on the Arxiv. That's over 4m items, 600m tokens, and 3.07 billion vector dimensions.

We're not stopping here. pic.twitter.com/b2288fbnJZ
— will depue (@willdepue) May 25, 2023

・Voyager: 組み込み型LLMを使用したMinecraftの生涯学習エージェント
Voyager: LLMを備えたオープンエンドの組み込みエージェント
-人間の介入なしに世界を継続的に探索し、多様なスキルを獲得し、新しい発見を行う
-Minecraft における初の LLM を利用した身体化された生涯学習エージェント
プロジェクト: https://t.co/71srCwYiCr
論文: https://t.co/rbCtBOQGLG https://t.co/j9VLB6ffG4

Voyager: An Open-Ended Embodied Agent with Large Language Models

Presents the first LLM-powered embodied lifelong learning agent in Minecraft that continuously explores the world, acquires diverse skills, and makes novel discoveries without human intervention.

proj:… pic.twitter.com/l915Is82lz
— Aran Komatsuzaki (@arankomatsuzaki) May 26, 2023

・ a16zのAIリソース集紹介
a16zより AI Canon
LLM と最新の AI についての論文、記事、コース、ビデオなどのリソース集

New post: the AI Canon

We share all the papers, posts, articles, courses, and videos we've relied on to get smarter about LLMs and modern AI

Compiled by @derrickharris @appenz and myselfhttps://t.co/bZ5tht1xWE
— Matt Bornstein (@BornsteinMatt) May 25, 2023

・OpenAIのGPT-5ローンチ時のオープンソース化に関する議論

Sam Altmanがミュンヘン工科大学でのイベントでOpenAIがGPT-5をローンチした場合には初日からオープンソースにするべきかと聞いたところ、多くの学生が手をあげた。

それに対してSamは初日からオープンソースにする気はないが、こういうリアクションがあること自体を知るのは面白いと語った。 https://t.co/temJgG3tCK pic.twitter.com/cMhPgeDS3i
— Tetsuro Miyatake (@tmiyatake1) May 26, 2023

・新しい3Dテキスト生成技術登場
ProlificDreamer
また新しいテキスト3D生成出てきた
(code coming soon)
プロジェクト: https://t.co/8wuk6xJ8pX
論文: https://t.co/XPTY6NDzqx

ProlificDreamer: High-Fidelity and Diverse Text-to-3D Generation with Variational Score Distillation

That croissant passed my tastiness Turing test.

proj: https://t.co/ALFwtcXXjd
abs: https://t.co/q83FobMVff pic.twitter.com/FKRtObAHN0
— Aran Komatsuzaki (@arankomatsuzaki) May 26, 2023

・ OpenAIがMicrosoft研究チームを追い越す理由についてのCEOの質問

Microsoft CEOのSatya Nadellaは去年の12月に社内で何故250人しかいないOpenAIがMicrosoftの1,500人体制の研究チームを追い越したのか質問し、「Micorosft Researchがいる意味はあるのか？」を聞いた。

どう自社研究とOpenAIの研究を組み合わせるのは難しい。https://t.co/CmhoI6WUID
— Tetsuro Miyatake (@tmiyatake1) May 26, 2023

・ Meta、100万トークン超のコンテンツ生成AI「Megabyte」を発表

Metaが既存の生成AIにあるトークン制限をはるかに上回る100万トークン超のコンテンツ生成を可能にする次世代AIアーキテクチャ「Megabyte」を発表https://t.co/UhYm43L1Pk
— GIGAZINE(ギガジン) (@gigazine) May 25, 2023

・ 65Bパラメータモデルを1日で1つのGPUで微調整可能

Think about how crazy this is:

You can finetune a 65B parameter model (50% of GPT-3) on ONE consumer GPU in ONE day.

If you don't have an A6000, then 2 3090's will do (~$1600).

All you need is:

• QLoRA
• Paged optimizers
• Gradient checkpointing

And they're easy to use. pic.twitter.com/Ss8AhE2ziP
— Mark Tenenholtz (@marktenenholtz) May 25, 2023

・Google ResearchのBreak-A-Sceneプロジェクトで画像から複数コンセプト抽出
Google Researchより
Break-A-Scene: 単一の画像から複数のコンセプトを抽出
プロジェクト: https://t.co/sT49cCNgxc
動画: https://t.co/zxg9LIiBgo
論文： https://t.co/Y6nDf2EjsB
コードは見当たらない https://t.co/eCzSUxMdB2 https://t.co/T3aJ5SYL9l

Break-A-Scene: Extracting Multiple Concepts from a Single Image

proj: https://t.co/3Dw60BNqxp
video: https://t.co/M4T0B7nJqm
abs: https://t.co/nlsIPjrL1M pic.twitter.com/xuLp9R9esK
— Aran Komatsuzaki (@arankomatsuzaki) May 26, 2023

・ AITuber向け記憶システムの完成

【祝】AITuberに最適化した記憶システム、完成！！！ pic.twitter.com/zRmO5B3A0r
— すでぃー@AITuber開発中 (@sudy_super) May 25, 2023

【5/20-5/26】生成AI活用事例/研究開発-Weeklyまとめ

活用事例

研究開発

いいなと思ったら応援しよう！