【5/6-5/12】生成AI活用事例/研究開発-Weeklyまとめ

2023年5月18日 18:30

今週のAIに関する活用事例や研究開発情報をまとめた記事です。

活用事例

・動画生成AI「Kaiber」の使い方（text2movie編） #SmartNews

動画生成AI「Kaiber」の使い方（text2movie編） #SmartNews https://t.co/DMSmoLfXRE
— shi3z (@shi3z) May 8, 2023

・元DeepMindのリーダーによるスタートアップ、Inflection AIがカジュアルな会話ができる「Pi」を提供開始
　-1年前2億2500万ドルを調達
　-他のチャットボットとの違いは、よりカジュアルで仮想的な交友関係が
　不健康な関係に陥ることがない点
　-カレンダー管理等も計画

・Lobelace Studioが、AI世界生成プラットフォームであるNyricを発表
デモ動画で、テキストからワールド生成してる
事前登録: https://t.co/m7wic8q9Ur https://t.co/RSvjN0NQjM

Announcing Nyric, an AI world-generation platform for digital communities.
Build the world of your dreams in seconds! pic.twitter.com/AxaVr78gJy
— Lovelace Studio (@NyricWorlds) May 8, 2023

・楽曲生成SongRの事例

鳥肌立った🔥
マジで、笑っちゃうくらい凄い。

とりあえず、これ聞いて下さい。
※音量注意

この曲はAIが生成しました。

いつの間にか音楽生成も、このレベルになっていたのは驚き。

もちろん皆さんも今すぐ使えます。プロンプトとURL置いとくので試してみて下さい。

▼SongRプロンプト

Street… pic.twitter.com/Byq7LlTSv1
— KEITO💻AIディレクター (@keitowebai) May 9, 2023

・ファストフードチェーンのウェンディーズが、ドライブスルーの注文を受けるAIチャットボットを試験導入
　-Googleと組んで開発中
　-6月にオハイオ州コロンバスの店舗で最初のテストが行われる予定
　-「Frosty」や「JBC」など、特定の用語を理解できるようにカスタマイズ

・AI x 出会いアプリ: Teaser AI

【AI x 出会いアプリ】

生成AI型マッチングアプリ『Teaser AI』。

インスタントカメラ風の写真共有アプリ『Dispo』をヒットさせたスタートアップが開発中らしい。

要するに
・別にチャット相手を探してるわけじゃない
・私たちは実際に会ってデートがしたいんだ… pic.twitter.com/0BL7Ggcl4L
— 森山大朗(たいろー) Work in Tech! (@tairo) May 10, 2023

・Salesforceが、自然言語で質問しインサイトを得ることができるTableau GPTの提供を開始
-自動的にビジュアライゼーションを作成し、関連しそうな質問やクエリも提案
-また、さらに革命的な可能性を秘めたAIのプロトタイプも開発している
-企業内のほとんどすべてを把握し、どのような製品を発売すべきか、どこで販売すべきか、世界全般の出来事が売上にどのような影響を与えるか、どのようなマーケティング活動が有効か無効か、会社はどこにもっと投資すべきか削減すべきかという洞察を提供することができる可能性を秘めているとのこと

・Microsoft 365のAI搭載「Copilot」が機能強化され、有料化へ
　-早期アクセスを希望する600名が利用可能
　-新しい検索であるSemantic Index、他Microsoft 　Whiteboard/Outlook/PowerPointのための新しい機能も発表
　-一般公開については未発表

・Semantic Index
プロンプトに対して、関連性の高い実用的な回答が可能
例えば、Copilotに「3月の売上報告書」について質問することで、単にそのキーワードを含む文書を探すのではなく、「売上報告書は財務チームのKellyが作成し、Excelで作成されている」と認識することが可能

Semantic Index
プロンプトに対して、関連性の高い実用的な回答が可能
例えば、Copilotに「3月の売上報告書」について質問することで、単にそのキーワードを含む文書を探すのではなく、「売上報告書は財務チームのKellyが作成し、Excelで作成されている」と認識することが可能 pic.twitter.com/ZVuDZMaf1d
— 納村聡仁 / Osamura Akinori (@akinoriosamura) May 10, 2023

・Whiteboard
特定のトピックに関するアイデアの創出やWhiteboardのコンテンツの要約を支援
また、Microsoft Designerを使用して、Whiteboardで作成されたアイデアのプロンプトを基に画像を生成し、アイデアを実現することが可能

Whiteboard
特定のトピックに関するアイデアの創出やWhiteboardのコンテンツの要約を支援
また、Microsoft Designerを使用して、Whiteboardで作成されたアイデアのプロンプトを基に画像を生成し、アイデアを実現することが可能 pic.twitter.com/Rwtxh7F0UM
— 納村聡仁 / Osamura Akinori (@akinoriosamura) May 10, 2023

・PowerPoint
画像生成のDALL-Eが追加
Copilotにテキストの説明に基づいて画像を生成するよう依頼し、プレゼンに含めることができるように
また、箇条書きを段落にしたり（またはその逆）、語調を変えたりといったテキストの最適化も可能

PowerPoint
画像生成のDALL-Eが追加
Copilotにテキストの説明に基づいて画像を生成するよう依頼し、プレゼンに含めることができるように
また、箇条書きを段落にしたり（またはその逆）、語調を変えたりといったテキストの最適化も可能 pic.twitter.com/kBiDqaY40A
— 納村聡仁 / Osamura Akinori (@akinoriosamura) May 10, 2023

・Outlook
文章作成のサポートを行う
メールのトーンを改善する方法を指導したり、デリケートな話題でより効果的な文章を提案など

Outlook
文章作成のサポートを行う
メールのトーンを改善する方法を指導したり、デリケートな話題でより効果的な文章を提案など pic.twitter.com/lMItGHBWvV
— 納村聡仁 / Osamura Akinori (@akinoriosamura) May 10, 2023

・ AkumaAI

ついに革命的なの来た．
キャラの音声やビジュアルまで設定できるし，音声に合わせて口も動く．名前や性格も設定可能．これが5分くらいで誰でも出来るから，AkumaAI本当にすごい． pic.twitter.com/QtrEA8SoQo
— ちゅーりん🌗 (@churin991116) May 10, 2023

・ Amazonが他社アプリやビデオゲーム内でAmazon上の商品を購入できる機能「Amazon Anywhere」をローンチ

Amazonが他社アプリやビデオゲーム内でAmazon上の商品を購入できる機能「Amazon Anywhere」をローンチ。

初期ユーザーはNianticが出したARゲームPeridotで、アプリ内でグッズをAmazon経由で購入できる。

バーチャル世界の中でフィジカル商品の購入が可能になる。https://t.co/i51hSjC84x pic.twitter.com/sga0TPL4mD
— Tetsuro Miyatake (@tmiyatake1) May 10, 2023

・Google が Project Tailwind を公開(in Labs)
　-個人的なメモで学習できる
　-学生向けツールとして位置づけ
　-ドライブからファイルを選択するだけで、パーソナライズされた
　AIモデルを作成可能
　-大量の学習ノートから情報を選択して、トピックに関する用語集などを
　作成可能

・Google IOで発表された新しいAI検索レイアウト
より詳細な検索を強化
折り返し部分と補助アセットに目立つようにリンク

Google's new AI search layout announced at IO, meant to enhance more detailed searches.

Contains links prominently above the fold and in supplementary assets -- good news for anyone that was concerned about this taking significant traffic. pic.twitter.com/CiUMNFAZvz
— Ross Hudgens (@RossHudgens) May 10, 2023

・Bard の回答
Gmail や Google ドキュメントに簡単にエクスポートできるように。 #GoogleIO

People often ask Bard for a head start drafting emails and documents, so today we’re making it easy to export Bard’s responses right into Gmail and Google Docs. #GoogleIO pic.twitter.com/CfIKf1IFCl
— Google (@Google) May 10, 2023

・Googleやウェブ上のサービスを利用して、
より多くの仕事をこなしたりできるよう、Bardで拡張機能をまもなく開始予定。プラグインみたいな感じかな？#GoogleIO

Soon we’ll launch extensions in Bard, tapping into services from Google and across the web to help you get more done and spark your creative explorations. These extensions will be enabled in a secure and private way. #GoogleIO pic.twitter.com/FmSs9OElPg
— Google (@Google) May 10, 2023

・例えば、今後数か月以内に、Adobe Firefly を Bard に統合して、
画像を生成編集したり、Adobe Express でデザインに追加したりできるように。 #GoogleIO

例えば、今後数か月以内に、Adobe Firefly を Bard に統合して、画像を生成編集したり、Adobe Express でデザインに追加したりできるように。 #GoogleIO pic.twitter.com/P9Ux23i4Kp
— 納村聡仁 / Osamura Akinori (@akinoriosamura) May 10, 2023

・Google Wordspace
Microsoft copilotのようなAIとコラボレーションできるDuet AI for Google Workspaceを発表

From the very beginning, @GoogleWorkspace was built for you to collaborate in real time with other people — and now you can also collaborate in real time with AI. #GoogleAI pic.twitter.com/rOER5kcLuq
— Google (@Google) May 10, 2023

・3 月には、テスター向けにGmailおよびDocsでのライティングに役立つAI 機能を公開済み
#GoogleIO

3 月には、テスター向けにGmailおよびDocsでのライティングに役立つAI 機能を公開済み#GoogleIO pic.twitter.com/k40TzSGVDw
— 納村聡仁 / Osamura Akinori (@akinoriosamura) May 10, 2023

・達成しようとしていることを説明するだけで、スプレッドシートが整理に役立つ計画を生成
テスターは来月利用できるように #GoogleIO

達成しようとしていることを説明するだけで、スプレッドシートが整理に役立つ計画を生成
テスターは来月利用できるように#GoogleIO pic.twitter.com/DPfYLbpeGG
— 納村聡仁 / Osamura Akinori (@akinoriosamura) May 10, 2023

・Slides
スライドを選び、簡単なテキストプロンプトを使用して、オリジナルビジュアルを生成
来月、テスターに公開 #GoogleIO

Slides
スライドを選び、簡単なテキストプロンプトを使用して、オリジナルビジュアルを生成
来月、テスターに公開#GoogleIO pic.twitter.com/S2oIZdMU5u
— 納村聡仁 / Osamura Akinori (@akinoriosamura) May 10, 2023

・検索での新しい生成AI体験により、1 回の検索でさらに多くの情報を得ることができるように
AI を活用したスナップショット、より自然な質問方法を探るためのポインターを使用して、情報をすばやく理解できるように
#GoogleIO

With our new generative AI experience in Search, you’ll get even more from a single search. You’ll be able to quickly make sense of information with an AI-powered snapshot, pointers to explore more and natural ways to ask. #GoogleIO pic.twitter.com/jgzz97DzEv
— Google (@Google) May 10, 2023

・絶えず変化する製品、販売者、ブランド、レビュー、
在庫の世界で最も包括的なデータセットである Google のショッピンググラフを活用 #GoogleIO

絶えず変化する製品、販売者、ブランド、レビュー、在庫の世界で最も包括的なデータセットである Google のショッピンググラフを活用#GoogleIO pic.twitter.com/OhXcvcUrIH
— 納村聡仁 / Osamura Akinori (@akinoriosamura) May 10, 2023

・GoogleIOと同時にscale_AIもリリース出してる
政府と企業を強化するための 2 つの主要なプラットフォームを立ち上げ
-Scale Donovan: 防衛のための AI copilot
-Scale EGP: グローバル企業向けの生成AIアプリ展開ソリューション
動画: Donovanデモ
CEOからの手紙: https://t.co/J0vd2cqRnU https://t.co/ljWhKUxg5D

Today, @scale_AI is launching our 2 major platforms to bolster government and enterprise:

🎖 Scale Donovan, the AI copilot for defense
🏙 Scale EGP, full-stack generative AI for global enterprise

👇 See Donovan in action below

🧵 on our platforms and why they are so critical pic.twitter.com/RcdtnL0Btj
— Alexandr Wang (@alexandr_wang) May 10, 2023

・Donovan: AI を活用した防御の意思決定
オペレーターの理解、計画、行動を数週間ではなく数分で支援するAI搭載のプラットフォーム

・Scale EGP
生成AIアプリを本番で展開するための、フルスタックのソリューション

・Googleが新しい生成AI技術をスマホアプリに導入することを発表
　-Androidのデフォルトメッセージアプリでメッセージの自動返信や文体
　の改善が可能に
　-Pixel限定で、AI生成の壁紙を提供
　-3D技術を利用したカメラ撮影機能の提供も計画されている

・Googleは新しいPhotos機能「Magic Editor」を発表
　-生成AIを使って、プロのツールなしに写真の大幅な編集を可能に
　-例えば、写真の中にいる人物を別の場所に移動させたり、背景の人物を
　消去することができる

・GoogleIOでvtuberモーションキャプチャソリューションをオープンソース化
新しい MediaPipe モデルは、ウェブカメラから 478 個の顔ランドマーク + 52 個のblendshapesを予測し、ARKit 装備のアバターと互換性https://t.co/4cgFGyYqWm
結構重宝してるmediapipe(というかそのモデル達)

It’s finally here! 🎊
We open sourced our #vtuber motion capture solution at #GoogleIO!

Our new MediaPipe model predicts 478 face landmarks + 52 blendshapes from your webcam and is compatible with any ARKit rigged avatar! 😺🧵 pic.twitter.com/WAgKayB8nO
— Rich 🍈 (@yeemachine) May 10, 2023

・ Googleの3D電話会議ブースプロジェクト

Googleの3D電話会議ブースプロジェクト「Starline」の最新プロトタイプではカメラ台数が減って、AIを活用して人の3Dモデルをリアルタイムで表現しているとのこと。https://t.co/ofMfDajJW8 https://t.co/FO4p2ReTCG pic.twitter.com/L7IwbXkRYR
— Tetsuro Miyatake (@tmiyatake1) May 11, 2023

・GoogleとAdobeが手を組んで、ARクリエイター向けツールのAdobe Aeroがパワーアップ！

GoogleとAdobeが手を組んで、ARクリエイター向けツールのAdobe Aeroがパワーアップ！

Adobe Aero上でGeospatial APIを使うことができ、ARコンテンツを地球上の様々な場所に配置可能！
しかも完成したAR体験はQRコードかリンクで配布可能なので、ARコンテンツの拡散も簡単！ pic.twitter.com/FrNr62dlDu
— ARおじさん / MESON CEO (@AR_Ojisan) May 10, 2023

・ Stability AIは開発者向けの強力なテキストからアニメーションを生成するツール、「Stable Animation SDK」をリリース

Stability AIは開発者向けの強力なテキストからアニメーションを生成するツール、「Stable Animation SDK」をリリース https://t.co/DT7q5TV6hV
— shi3z (@shi3z) May 11, 2023

研究開発

・MPT-7Bというオープンソース大規模言語モデルが公開

MPT-7Bというオープンソース大規模言語モデルが先ほど公開されたのですが，オープンソースの本命という気がしますhttps://t.co/8BU5N4mCOG
・商用利用可能
・6万5000トークン使用可能（GPT-4の2倍！）
・7Bと比較的小さいモデルながら,かなり高性能
・日本語を扱え,性能もかなり高い（超重要）… pic.twitter.com/3KVk8SDiQd
— 今井翔太 / Shota Imai@えるエル (@ImAI_Eruel) May 5, 2023

・「StableVicuna」をリリース

【お知らせ】
世界初のオープンソースRLHF LLMチャットボット「StableVicuna」をリリースしました。
StableVicunaは、Vicuna v0 13bをさらに細かく指示で微調整し、RLHFで訓練したバージョンです。
いくつかのベンチマークで、alpaca13bを上回っています。https://t.co/lSGtHXHw3G #StabilityAI pic.twitter.com/XXvQiT239i
— Stability AI 日本公式 (@StabilityAI_JP) May 3, 2023

・音声生成AIのBarkがMITライセンスに

高品質で話題になった音声生成AIのBark、MITライセンスになった！！！！
商用利用禁止だったのでローカルテストしてなかったけど、これは試さねば！ https://t.co/7b2LyBBOsF
— kogu (@koguGameDev) May 2, 2023

・テキストから3D人間モーションを検索するTML

テキストから3D人間モーションを検索する奴🔍

HumanML3Dとか数万の3Dモーションとテキストのペアがあるけど、TMRなら文字列一致しなくても精度良く動きが検索できる？

TMR: Text-to-Motion Retrieval Using Contrastive 3D Human Motion Synthesishttps://t.co/n8cUg4a52V https://t.co/Cj3ZyVT8dx pic.twitter.com/0yvq5QXgOf
— forasteran (@forasteran) May 3, 2023

・1兆トークンのテキストとコードで学習された67億パラメータ言語モデル「MPT(MosaicML Pretrained Transformer)」が発表

1兆トークンのテキストとコードで学習された67億パラメータ言語モデル「MPT(MosaicML Pretrained Transformer)」が発表された。440 A100で9.5日で学習。費用は20万ドル(約2700万円)。LLaMA-7Bと同等性能だが商用利用可でオープンソース！さらに、微調整した3つのモデルも公開https://t.co/CNaZ7EcGLg
— 小猫遊りょう（たかにゃし・りょう） (@jaguring1) May 5, 2023

・商用利用可能な複数の言語モデル「RedPajama-INCITE」が発表

今日、商用利用可能な複数の言語モデル「RedPajama-INCITE」が発表された。パラメータ数は約28億個と約69億個のモデル群。LLaMAのレシピを可能な限り再現するモデルとインストラクトチューニング版とチャット版を公開。8000億トークンまで学習（1兆トークンまで学習する予定）https://t.co/VMJ87nCfBS
— 小猫遊りょう（たかにゃし・りょう） (@jaguring1) May 5, 2023

・食べログ、ChatGPTプラグインの提供を開始

食べログ、ChatGPTプラグインの提供を開始https://t.co/MQjnHIM1Iv pic.twitter.com/zjuMi5rqat
— やまかず (@Yamkaz) May 8, 2023

・気づいたらChatGPT pluginかなり増えてた
（スレッドに続く）

気づいたらChatGPT pluginかなり増えてた
（スレッドに続く） pic.twitter.com/kUHtHhSPpo
— 納村聡仁 / Osamura Akinori (@akinoriosamura) May 9, 2023

・RWKV LangChainのノートブックが追加されてる

RWKV LangChainのノートブックが追加されてるhttps://t.co/CB15UoemoV
— 布留川英一 / Hidekazu Furukawa (@npaka123) May 8, 2023

・賞金総額100万ドルの言語モデルコンペ
評価方法は、モデルを数百万人のユーザーに直接配布して測定するとのこと
組織票大丈夫やろかと思ったけど、ペイしないか

The Guanaco Challenge: fine tune language models at home and compete for $1 million cash prize, starts June 10th 2023.

Find out more at https://t.co/aQSwjDh7fT
— Thomas Rialan (@thomasrialan) May 8, 2023

・プロンプトから3Dモデルを作るShap-E

OpenAIが公開した、プロンプトから3Dモデルを作るShap-E。こちらから試せます。作ったモデルのダウンロードもできます。https://t.co/7teHgFCgNC
下の画像は"gray round coffee table"で作りました。
まだまだ性能としては不十分ですが、可能性を感じさせますね！ pic.twitter.com/158Zcrco66
— やのせん@VR/メタバース教育 (@yanosen_jp) May 9, 2023

・テクスチャなしCGからControlNetで生成の検証

適当なテクスチャなしCGからControlNetで生成の検証。グレー画像のみでほとんど何もしてないのに何故ControlNetはこれだけ上手く処理するのか驚く pic.twitter.com/WvVeK1qSYw
— Hirokazu Yokohara (@Yokohara_h) May 9, 2023

・LLM Studio

LLM Studio を味見しました. GUI でポチポチでﾌｧｲﾝﾁｭｰﾝ行けそうでした😳

> h2o LLM Studio でぺろっと LLM ﾌｧｲﾝﾁｭｰﾝしたいメモ https://t.co/yFacmD5Cvk
— syoyo.eth 🌸 レイトラ ® 🐯 5 周年 🎉 (@syoyo) May 9, 2023

・ Metaがテキスト、音声、ビジュアル、温度、動きなど様々な情報を同時に取り入れるAIモデルを開発

Metaがテキスト、音声、ビジュアル、温度、動きなど様々な情報を同時に取り入れるAIモデルを開発してる。

人間のように複数のインプットからコンテキストを読み取る能力をAIに学ばせるのは興味深い。

今後は匂い、神経信号、感触などのインプットも取り入れられると記載。https://t.co/uAEvbI3p2X pic.twitter.com/2hkTn5lfzi
— Tetsuro Miyatake (@tmiyatake1) May 9, 2023

・ワンショットでセグメンテーションのチューニングしてるけどま？
論文: https://t.co/FKLpNDxWu5
huggingface: https://t.co/DdEaWMYSPt
GitHub: https://t.co/LtTYgbTt0X https://t.co/zk1TFRM2yg

Personalize Segment Anything Model with One Shot

abs: https://t.co/SAki2YWGV4
paper page: https://t.co/L7OcyTqIck
github: https://t.co/gr388OpkKF pic.twitter.com/5XZOiFuA2J
— AK (@_akhaliq) May 5, 2023

・言語モデルで言語モデル動作説明生成・スコアリング
　-GPT-4を使って別の言語モデルのニューロンの動作説明を生成、
　スコアリング
　-アライメント研究に対する3つ目のアプローチ
　-アライメント研究の作業そのものを自動化することの一部

・ Google Colab で ImageBind を試す｜npaka @npaka123 #note https://t.co/OpAZNIQZBq

Google Colab で ImageBind を試す｜npaka @npaka123 #note https://t.co/OpAZNIQZBq
— 布留川英一 / Hidekazu Furukawa (@npaka123) May 10, 2023

・米ＩＢＭ、ＡＩとデータの新基盤「ｗａｔｓｏｎｘ」を発表

米ＩＢＭ、ＡＩとデータの新基盤「ｗａｔｓｏｎｘ」を発表 https://t.co/9TpVjiTQ9G "企業は「ｗａｔｓｏｎｘ」を活用することでＡＩモデルの訓練と展開、自然言語を使用したコードの自動生成、気候変動モデリングなど目的別のさまざまな大規模言語モデルの利用が可能となる"
— うえぞう@うな技研代表 (@uezochan) May 9, 2023

・コードネーム「Burnham」
　-Amazonは、ChatGPTのような機能を持ち、周囲の状況をより多く
　理解する新型ホームロボットを密かに開発中
　-理解したことについてQ&Aで対話し、それに基づいて適切な行動を
　取ることが可能
　-例えば、「Burnham」に鍵の置き場所を聞いたりできるそう

・ GCP AIモデル (bison, gecko) の使用料金

GCP AIモデル (bison, gecko) の使用料金。かなり安い。

chatモデルは gpt-3.5-turbo の4分の1。
textモデルは text-davinci-003 の 20分の1。 pic.twitter.com/8G2d70qlbF
— Shinji Yamada (@santa128bit) May 10, 2023

・ GCP AIモデルに関して

4モデルあって、現在、bisonがtext, chatとして、geckoがembeddingとしてAPIが提供されている。OtterとUnicornはどこ？少し試したけど、Bardは微妙にBisonより精度低く感じるので、BardがOtterなのかもしれない。Unicornはどこ？https://t.co/YAId51QEBO
— Shinji Yamada (@santa128bit) May 10, 2023

・Gemini
Google DeepMindの次世代マルチモーダル基盤モデル

❗Introducing Gemini

Google DeepMind's next-generation multimodal foundation model. pic.twitter.com/IGQHjAoNUy
— Smoke-away (@SmokeAwayyy) May 10, 2023

・PaLM API

お？ PaLM API 既にGCPで使えるじゃん。Playgroundいいね。 pic.twitter.com/GL29wHA2nj
— Shinji Yamada (@santa128bit) May 10, 2023

・Vertex AI に 3 つの新しいモデルを導入
　・Imagen: 画像の生成とカスタマイズを強化
　・ Codey: コード生成を支援することで、アプリケーションをより迅速に
　　構築できるように
　・音声モデルChirp: 100 以上の言語で音声テキスト変換を #GoogleIO

Today, we’re introducing 3 new models in Vertex AI:
• Imagen powers image generation and customization.
• Codey lets you build applications faster by helping with code generation.
• Chirp, a universal speech model, brings speech-to-text accuracy to 100+ languages. #GoogleIO pic.twitter.com/KniZS2zffl
— Google (@Google) May 10, 2023

・Google Cloud 向けの Duet AI
コンテキストに応じたコード補完を支援し、リアルタイムで関数を生成し、コードベースに合わせて調整された提案を提供し、コードレビューを支援
#GoogleIO

Also new: Duet AI for Google Cloud, an AI-powered collaborator, which helps with contextual code completion, generates functions in real time, offers suggestions tuned to your code base, assists with code reviews and more. #GoogleIO
— Google (@Google) May 10, 2023

・PaLM API
PaLM 2 を利用し、Firebase や Colab などの Google デベロッパーツールに統合 #GoogleIO

Our PaLM API is powered by PaLM 2, our next generation large language model. We’ve integrated it into Google developer tools like Firebase and Colab. #GoogleIO
— Google (@Google) May 10, 2023

・今回発表された機能含め、様々な新しいAIプロダクトの早期テスターになれるLabs
1/Search Labs(新しい検索)
2/DuetAI for Google workspace(生成AI)
3/project tailwind(AIノートブック)
4/MusicLM(音楽生成)
https://t.co/NHFpTlKy3x #GoogleIO

Today we’re opening sign-ups to Search Labs for U.S. English users, and we’ll expand availability over time. Tap the Labs icon in the latest version of the Google app or Chrome desktop to join the waitlist or go to https://t.co/BfJ8KhzzYz. #GoogleIO pic.twitter.com/GR9EtUxhHo
— Google (@Google) May 10, 2023

・2/DuetAI for Google workspace(生成AI)

2/DuetAI for Google workspace(生成AI)https://t.co/yQesXbmQpT
— 納村聡仁 / Osamura Akinori (@akinoriosamura) May 10, 2023

・3/project tailwind(AIノートブック)

3/project tailwind(AIノートブック) https://t.co/11J60SOq2e
— 納村聡仁 / Osamura Akinori (@akinoriosamura) May 10, 2023

・4/MusicLM(音楽生成)

4/MusicLM(音楽生成)https://t.co/vMALMXSBlM
— 納村聡仁 / Osamura Akinori (@akinoriosamura) May 10, 2023

・ PaLM 2のテクニカルレポート

https://t.co/GlaRrOaFrp
PaLM 2のテクニカルレポートが出ている。
ついにグーグルもアーキテクチャなど詳細は非公開か。
でもPaLMよりパラメータは大幅に小さいらしくそれなのに性能が良い。PaLMのデータ量よりはるかに大きいデータで学習していると書かれている。
多言語に強くGPT-4前後の推論能力
— bioshok(INFJ) (@bioshok3) May 10, 2023

・グーグルが最先端の汎用言語モデル「PaLM2」を発表

今日、グーグルが最先端の汎用言語モデル「PaLM2」を発表！

PaLMを多くのタスクで凌駕。多言語と論理推論で能力向上（特に日本語！）PaLMよりかなり小さいモデルだが、PaLMよりも学習に多くの計算回数を投じてるとのこと。chinchillaのスケーリング則の知見を踏まえてるそうhttps://t.co/HYlB6ZOgiG pic.twitter.com/NSTeAGpyqd
— 小猫遊りょう（たかにゃし・りょう） (@jaguring1) May 10, 2023

・ Stable Diffusion AI Deepfake

Stable Diffusion AI Deepfake

De-Aged Harrison Ford

SD+ControlNet+EbSynth+Fusion

reddit thread: https://t.co/S4yQvjlMKW pic.twitter.com/4RL5woVCXn
— AK (@_akhaliq) May 10, 2023

・言語モデル開発のcohereAI
10言語のWikipediaの埋め込みベクトル9400万個をオープンソースで公開してくれてるとのこと。
あと、より最適に使うためのlangchainのContextual CompressionやcohereAIのrerankモデルに関してスレッドで説明してくれてる

Did you know @CohereAI open-sourced 94 million vectors of Wikipedia embeddings from 10 languages? And @weaviate_io hosted 10 million of them to search for free?
With a few lines of code using @LangChainAI you can retrieve them. But we face one issue, let's solve 🧵↓ pic.twitter.com/n8U75HZGZl
— Misbah Syed (@MisbahSy) May 10, 2023

・huggingfaceより、マルチモーダルエージェントAPIの公開
　-テキスト、オーディオ、画像、動画、時系列など、10万以上のHFモデル　　　　
　(stable diffusion, whisper, OpenAssistant...)を、コマンドに基づいて
　自動的にチェーンできる
-オープンソース
-ローカルで動作可能

Excited to announce our multi-modal agent API that can automatically chain 100,000+ of HF models (stable diffusion, whisper, OpenAssistant,...) for text, audio, image, video, time-series,… based on your commands.

All open-source so it can work locally!https://t.co/Xxq4y2QBOu pic.twitter.com/uIi0K1xwLw
— clem 🤗 (@ClementDelangue) May 10, 2023

・v4.29.0: Transformers Agents, SAM, RWKV, FocalNet, OpenLLaMa

HuggingFace transformers v4.29.0 きてた。

v4.29.0: Transformers Agents, SAM, RWKV, FocalNet, OpenLLaMahttps://t.co/PI9QDPfA0L
— 布留川英一 / Hidekazu Furukawa (@npaka123) May 10, 2023

・フルスクラッチで作る画像生成AI

個人が0から画像生成AIを作るとどうなるかを知ることができます。よいこのみなさんは真似しないようにしてください。第1回Generative AI勉強会関西で発表した内容になります。 #ChatGPT

フルスクラッチで作る画像生成AI | あるふ #docswell
https://t.co/2AkB7zcbol
— あるふ (@alfredplpl) May 11, 2023

・Claude のコンテキストウィンドウが9Kから100Kトークンに拡張

#Claude のコンテキストウィンドウが9Kから100Kトークン(約7万5千語)に拡張されたｗ

『The Great Gatsby』(47,094語)全文が入力できる📖
(GPT-4は最大トークン数32kで無理)

ClaudeはAnthropic開発のチャットAI

100Kコンテキストウィンドウの紹介https://t.co/YEsM0lleAS https://t.co/X46GrtFMpn
— forasteran (@forasteran) May 12, 2023

・Allen AI研究所が、オープンな言語モデルAI2 OLMo(Open Language Model)の作成に乗り出すことを発表
　-700億パラメータ
　-2024年初頭の完成を予定

Today we're thrilled to announce our new undertaking to collaboratively build the best open language model in the world: AI2 OLMo.

Uniquely open, 70B parameters, coming early 2024 – join us!https://t.co/9lQ2KYVC0v
— Allen Institute for AI (@allen_ai) May 11, 2023

【5/6-5/12】生成AI活用事例/研究開発-Weeklyまとめ

活用事例

研究開発

いいなと思ったら応援しよう！