![見出し画像](https://assets.st-note.com/production/uploads/images/115912186/rectangle_large_type_2_395348f87e559383a1a0cb78533dd62a.jpeg?width=1200)
【9/2-9/8】生成AI活用事例/研究開発-Weeklyまとめ
今週のAIに関する活用事例や研究開発の備忘録記事です。
活用事例
・デジタル庁がChatGPTの業務組み込み方法を公開
デジタル庁で公開している「ChatGPTを業務に組み込むためのハンズオン」。
— 河野太郎 (@konotarogomame) August 24, 2023
ぜひ、参考にしてください。https://t.co/zgC9j4eKGm
・ゲームアセット生成AI Scenario: スプライトアニメーションの作り方
・妻の歌声を合成して10年が経って、本人不在のミュージックビデオがAIでこんな感じになりました(CloseBox)
作例とか追加しました。
— Koya Matsuo (@mazzo) September 4, 2023
妻の歌声を合成して10年が経って、本人不在のミュージックビデオがAIでこんな感じになりました(CloseBox) @TechnoEdgeJP https://t.co/B8aOIc88cQ pic.twitter.com/Sl633Iyvs6
・GPTを搭載し、言葉を解する驚異的な四本脚ロボット
GPTを搭載し、言葉を解する驚異的な四本脚ロボット。しかもかなり廉価。今はグロいが見慣れれば可愛くなる。またデザインはいくらでも工夫できる。未来だ。#UnitreeGo2https://t.co/eEoRf5akqX pic.twitter.com/EZ8Zn22qjb
— Kaz Ataka / 安宅和人 (@kaz_ataka) September 5, 2023
・serial experiments lain 25周年プロジェクトにAI lainが登場!
/ serial experiments lain 25周年プロジェクトに
— serial experiments lain (@1998_lain) September 5, 2023
「AI lain」が登場!
\
みんなでlainを育てましょう。AI lainは、本物の声を発する玲音とビデオ通話を楽しむ対話型サービスです。 玲音は、あなたの言葉や問いかけに、テキストだけではなく、温もりのある本物の玲音の声で話しかけてくれます。
➡️… pic.twitter.com/IRVLdus0qN
・三重県桑名市、AI作詞・作曲の校歌を採用。iU・理研AIPの共同研究
・【こぼれ話】百度のオンラインオフィスツール「文庫」に同社の文心一言によるAI生成機能がつき、プレゼンや講演原稿など各種ファイルが作成可能に
【こぼれ話】百度のオンラインオフィスツール「文庫」に同社の文心一言によるAI生成機能がつき、プレゼンや講演原稿など各種ファイルが作成可能に。これはスタバ社員が月餅を紹介することになり生成した様子ですが、中国では急なオーダーがよくありAI活用は必須になるかも?https://t.co/EVxEJg0Ck3 pic.twitter.com/iv6rF5fzxG
— 36Kr Japan@中国テック・スタートアップ専門メディア (@36krJ) September 5, 2023
・3Dアニメ生成AI開発のIreverent Labs、 Samsung Nextから戦略的投資を受ける——サムスン製品への導入視野に
当初はゲームやクリエイティブ産業に焦点を当てる計画だが、提携により一般大衆への展開も視野
今年後半に開発者向けのプレビュー版をリリース予定
・Automatic1111でSDXLのControlNetが対応
🟥速報🟥
— 【Ai建築デザイナー】YUiCHI (@YUiCHI_Bi) September 5, 2023
Automatic1111でSDXLのControlNetが対応しました!
CN対応によってSDXLの汎用性が上がったので、高画質かつ実務的な建築生成が可能になります。
ControlNet拡張リンクhttps://t.co/RsGCz674PR
モデルのダウンロードリンクhttps://t.co/ZtSBMjSWmB https://t.co/TPuQak8sJ3
・AIが生成したロイヤリティ・フリーの音楽
・Open Interpreter - ローカルでコードを実行し、多機能なテキストインターフェイスを提供
LLMはコード(Python、Javascript、Shellなど)をローカルで実行
テキストインターフェイスを通してOpen Interpreterとチャット可能
写真/ビデオ/PDFなどの作成編集、ブラウザ操作/調査、データプロット、クリーニング、分析など
・好きなアーティストのAIソングカバーを生成するSingify
好きなアーティストのAIソングカバーを生成するSingify
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 5, 2023
1.音声モデルの選択
2.曲を追加するhttps://t.co/jFfJDsMvzeソングカバーの生成
データどうしてるんやろhttps://t.co/YvymuaEpJM pic.twitter.com/mrJYrNRu2a
・DeepMindよりVisualisingAI
DeepMindよりVisualisingAI
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 6, 2023
- AIをより多様でわかりやすく表現するために、世界中のアーティストに制作を依頼
- 13人のアーティストに100以上のアートワークの制作を依頼し、1億ビュー、80万ダウンロードを達成
- 誰でも無料で画像やモーショングラフィックをダウンロード可能 https://t.co/iNBISP19jv pic.twitter.com/lBDU342hKd
・半導体AI設計支援の威力、ソニーセミコン「設計工数が30分の1に」
・「Google Meet」の背景をジェネレーティブAIで生成可能に - 窓の杜
・Zoom AI Companion
Zoom AI Companion
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 6, 2023
- 有料アカウントは追加料金なしで今すぐ利用可能
- 聞き逃した内容を要約提供してもらえる
- 会議の内容に関する質問可能
- 録画を自動的にスマートチャプターに分割し確認、重要な情報をハイライト、ネクストアクション作成
- メール作成
-… https://t.co/RcOF4daMDG pic.twitter.com/sFSSaECk7b
・MSが10/3のOneDriveのイベントで、AIを活用した新しい検索、共有、情報クエリのプランを紹介予定https://techcommunity.microsoft.com/t5/microsoft-onedrive-blog/join-us-on-oct-3-for-an-exclusive-onedrive-event/ba-p/3915320…
・大阪市、アマゾン ウェブ サービスとPwCコンサルティングとの生成AI連携協定締結
大阪市、アマゾン ウェブ サービスとPwCコンサルティングとの生成AI連携協定締結
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 7, 2023
- 政令指定都市による生成AI連携協定の締結は初
- 連携協定の目的は市民サービス向上と業務効率化https://t.co/B0WFm2Jf2M
・Apple、会話AI開発への投資強化
Apple、会話AI開発への投資強化
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 7, 2023
- AIを構築するコンピューティング予算を1日数百万ドルにまで拡大
- 目標のひとつは、簡単な音声コマンドを使って複数のステップを含むタスクを自動化できる機能
- 例えば、Siriに最近撮った5枚の写真でGIFを作成し、友人に送信するなどhttps://t.co/aVllsLc32K
・「非弁行為」がクリアに、弁護士のAI利用が加速
・【こぼれ話】シャオミのスマホのUIに搭載された生成AIのチャットボットレビュー記事
【こぼれ話】シャオミのスマホのUIに搭載された生成AIのチャットボットレビュー記事です。名前は同社のスマートスピーカーから続く「小愛同学」。アプリやWEBブラウザ要らずで、画面下より利用でき、普通に答えたり孔子風に答えたりプレ面接をしたりすることができるようですhttps://t.co/rJxItSFkvg pic.twitter.com/3zJNChBKA5
— 36Kr Japan@中国テック・スタートアップ専門メディア (@36krJ) September 7, 2023
・ドレイクのAIソングを制作した匿名のクリエイター、Ghostwriterが新たな楽曲を発表
ドレイクのAIソングを制作した匿名のクリエイター、Ghostwriterが新たな楽曲を発表
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 7, 2023
- トラヴィス・スコットと21サヴェージの声をフィーチャーした新曲
Ghostwriter: https://t.co/HdRNXflZA9
記事: https://t.co/kX1OCtWPb6 @Vergeより
・Slackが、チャンネルやスレッドを再確認できるAIツールテストを今冬開始
Slackが、チャンネルやスレッドを再確認できるAIツールテストを今冬開始
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 7, 2023
- チャンネルのディスカッションやスレッドを要約したり、関連するメッセージ、ファイル、チャンネルから回答を検索したり可能https://t.co/fiZFrv1PRK @Vergeより pic.twitter.com/s3AROAIXXf
・AIチャットボットで機能増強、外国語Q&Aサービス「HiNative」
・[LLM 論文]自動でプログラムのバグを修正する次世代技術"Repilot"の日本語解説|すめらぎ
面白そうなLLMの論文があったのでChatGPTに解説してもらいました。
— すめらぎ (@marudog_01) September 6, 2023
ソースコードも公開されてるので、今度見た上でもうちょい易しい説明を自分で書こうと思います。
[LLM 論文]自動でプログラムのバグを修正する次世代技術"Repilot"の日本語解説|すめらぎ https://t.co/5dvl6489a3
・弁護士ドットコムが以下のリリース出してたの知らなかった
弁護士法第72条に関するガイドライン公表に伴い、6領域21ビジネスの事業開発を開始
弁護士ドットコムが以下のリリース出してたの知らなかった
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 7, 2023
弁護士法第72条に関するガイドライン公表に伴い、6領域21ビジネスの事業開発を開始- 本領域に挑戦したい弁護士・エンジニアの採用、企業投資を加速 - https://t.co/Rf95uiEDKE @PRTIMES_JPより
・第2回国際AI映画祭がこの春、ニューヨークとロサンゼルスで開催
第2回国際AI映画祭がこの春、ニューヨークとロサンゼルスで開催https://t.co/P8HyH1ICBr https://t.co/mKHYkxNhZI pic.twitter.com/aGM69hlVsL
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 7, 2023
・今年の上半期には美図(Meitu)はさらにAI作成系アプリで攻勢をかけました
今年の上半期には美図(Meitu)はさらにAI作成系アプリで攻勢をかけましたhttps://t.co/qZVtD68FBb
— 36Kr Japan@中国テック・スタートアップ専門メディア (@36krJ) August 30, 2023
・AIファイナンシャルアシスタント Intuit Assist
AIファイナンシャルアシスタント Intuit Assist
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 7, 2023
- 請求書発行、目標達成のアクションプラン作成、財務に関する緊急の質問への回答などのタスクやワークフローを自動化
- 業績や顧客の行動に基づいて洞察を提示
- 中小企業が十分な情報に基づいた意思決定を可能にhttps://t.co/75d2uZ8VBc https://t.co/rAtDT3c8Xx pic.twitter.com/WcDD40SOrW
・Google、機械学習プラットフォーム「Vertex AI」の次なる展開を披露〜Google Cloud Next 2023から
Google、機械学習プラットフォーム「Vertex AI」の次なる展開を披露〜Google Cloud Next 2023から
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 7, 2023
- PaLM2がトークン長を32,000トークンに拡張
- アラビア語、中国語、日本語、ドイツ語、スペイン語を含む38カ国語に対応
- Codeyのコード生成の品質を最大25%向上
-…
・マーケティング・CRMプラットフォームのHubSpotがプラットフォーム全体にAIを統合する戦略を発表
マーケティング・CRMプラットフォームのHubSpotがプラットフォーム全体にAIを統合する戦略を発表
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 7, 2023
- コンテンツアシスタント
ユーザーがプラットフォーム上のどこにいるかというコンテキストの中で、必要なコンテンツ生成をサポート
- AIエージェント(来年利用可能)…
・「生成AIのコミュニティからスターを誕生させたい!」 アキバで開催される「AIフェスティバル」にかける意気込みとは?
「生成AIのコミュニティからスターを誕生させたい!」 アキバで開催される「AIフェスティバル」にかける意気込みとは? https://t.co/JHVFvdmZog #Sponsored pic.twitter.com/E7eee5aUIN
— 窓の杜 (@madonomori) September 7, 2023
・Anthropic、AI搭載チャットボットの有料プランClaude Proを開始
Anthropic、AI搭載チャットボットの有料プランClaude Proを開始
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 8, 2023
- 米国では月額20ドル
- 5倍多い使用量、より多くのメッセージ送信、トラフィックの多い時間帯の優先アクセス、新機能への早期アクセスなど
- 8時間ごとに少なくとも100メッセージを送信できるようにhttps://t.co/pIAh7kxYCd
・ローコードプラットフォーム「Retool」、ビジネスアプリへのAI活用を容易に
ローコードプラットフォーム「Retool」、ビジネスアプリへのAI活用を容易に
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 8, 2023
- カスタムデータをLLMに組み込み、モデルが最新の情報にアクセスできるように
- テキストの要約や分類、画像生成なども多数発表https://t.co/juqQuKm6YE pic.twitter.com/bEQsIvZi9p
・eBay写真から商品リストの生成ツールを発表
eBay写真から商品リストの生成ツールを発表
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 8, 2023
- iOSアプリで利用可能
- Androidも数週間以内に予定
- 写真に基づいてタイトルと説明文などを自動作成、カテゴリー、定価、送料などを提案
- 他の企業だと、ShopifyはAI生成商品説明を、AmazonはAI生成レビュー要約を展開https://t.co/4SaTVHoEOX pic.twitter.com/M6ZZAUgpje
・新Greylock GPとして任命されたSeth RosenbergがAIネイティブ・AIファーストな企業の注目領域を解説
新Greylock GPとして任命されたSeth RosenbergがAIネイティブ・AIファーストな企業の注目領域を解説した。
— Tetsuro Miyatake (@tmiyatake1) September 8, 2023
・AIファーストなネットワーク・マーケットプレイス
・エンタープライズソフトウェアカテゴリーの見直し
・サービスのコパイロット
詳細は以下スレッドにて↓ pic.twitter.com/6lXGKtx1nP
・MSは、Copilot AIの商用ユーザーが訴えられた場合、法的責任を負う
MSは、Copilot AIの商用ユーザーが訴えられた場合、法的責任を負う
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 8, 2023
- 第三者がMSのCopilotやCopilotが生成する出力を使用した商業顧客を著作権侵害で訴えた場合、ガードレールとコンテンツフィルターを使用している顧客を弁護し、訴訟の結果生じた不利な判決や和解の金額を支払う…
研究開発
・AIフィードバックによる強化学習のスケーリング
RLAIF: Scaling Reinforcement Learning from Human Feedback with AI Feedback
— Aran Komatsuzaki (@arankomatsuzaki) September 4, 2023
Shows that RLAIF can produce comparable improvements to RLHF without depending on human annotatorshttps://t.co/5GaNmp4EbD pic.twitter.com/Q8ucCsSKC6
・2023年度統計関連学会連合大会で大規模言語モデルに関するチュートリアル
2023年度統計関連学会連合大会で大規模言語モデルに関するチュートリアル(3時間)を行いました。言語モデルやTransformerの基礎から最近の大規模言語モデルに至るまでの流れを整理しました。
— Naoaki Okazaki (@chokkanorg) September 4, 2023
スライド: https://t.co/dh9Z01aPJo
チュートリアル: https://t.co/PBZqx3cyzr pic.twitter.com/DrYB1hLezx
・1本50円で外注できるAIソフトウェア開発環境「ChatDEV」、人の声を理解する言語モデル「LLaSM」など重要論文5本を解説
・Microsoft、AIスマートバックパックを実現する特許
・「Stability AI Japanにおける大規模言語モデルの研究開発」というテーマで発表
昨日行われたLLM勉強会にて、弊社のMengが「Stability AI Japanにおける大規模言語モデルの研究開発」というテーマで発表させていただきました。
— Stability AI 日本公式 (@StabilityAI_JP) September 4, 2023
Stability AI Japanではこれからも日本の皆様と切磋琢磨しながらより良いモデルの開発に努力してまいります。https://t.co/9HBoGlwIqv pic.twitter.com/iikLdDyyep
・AIがチームを組み、ゲーム攻略するシステム 中国チームが開発 マインクラフトなどで実験
専門家AIが複数待機しタスク(ゲーム開発,ゲーム攻略,DB管理等)ごとに必要なAIだけ集められそのチームで会議し処理する仕組み。汎用性高いAI協力系。添付映像:ポケモン攻略タスク中など
AIがチームを組み、ゲーム攻略するシステム 中国チームが開発 マインクラフトなどで実験 https://t.co/HfJVaTe6l9 専門家AIが複数待機しタスク(ゲーム開発,ゲーム攻略,DB管理等)ごとに必要なAIだけ集められそのチームで会議し処理する仕組み。汎用性高いAI協力系。添付映像:ポケモン攻略タスク中など pic.twitter.com/6wC0osIgqa
— Seamless (@shiropen2) September 5, 2023
・テキスト指示からリアルな立体物をつくる多視点拡散モデル「MVDream」 中国バイトダンスなどの研究者らが開発
テキストプロンプトだけからキャラやメカ,アイテムなどの高精度の3Dモデルを自動生成する。ぼやけたり欠けたり等の欠損が少なく精密で高忠実度な仕上がりを出力。
テキスト指示からリアルな立体物をつくる多視点拡散モデル「MVDream」 中国バイトダンスなどの研究者らが開発 https://t.co/1rJmxjoKxS テキストプロンプトだけからキャラやメカ,アイテムなどの高精度の3Dモデルを自動生成する。ぼやけたり欠けたり等の欠損が少なく精密で高忠実度な仕上がりを出力。 pic.twitter.com/aQarme1ZG2
— Seamless (@shiropen2) September 5, 2023
・【藤本健のDigital Audio Laboratory】AI超進化で“ことり”どうなる!? 歌声処理技術の最前線を見た-AV Watch
・ハイパフォーマンスな医療特化の画像セグメンテーションモデル『SAM-Med2D』が開発https://twitter.com/ai_database/status/1698904034718240981
・AIと香りのパイオニアであるOsmoは、科学誌Scienceに画期的な論文を発表
- GNNを用いて、香りの予測において人間を凌駕
- 一般化された匂いマップであるPOMを作成 - 5,000個の分子のデータセットで訓練
- 分子構造のみに基づいて、嗅いだことのない何百もの分子の香りを予測
- 50万個の潜在的な匂い分子について、匂いの強さや知覚的類似性など、様々な匂い特性を特徴付け
・GPT4, gpt-3.5-turbo, PaLM2, ELYZA-japanese-Llama-2-7b等のLLMを使って、動画学習サービスの理解度チェックテストを解かせた精度検証
GPT4, gpt-3.5-turbo, PaLM2, ELYZA-japanese-Llama-2-7b等のLLMを使って、動画学習サービスの理解度チェックテストを解かせて精度検証を行った良記事です!
— kambarakun (@kambarakun) September 4, 2023
Fine-tuningの効果検証とfew-shot promptingについても触れています。
--https://t.co/7zhfmtQGxW
・AudioLDM2
めっちゃギターのうまいメイドSSWさん🎸
— forasteran (@forasteran) September 5, 2023
うたってほしー(↓声も生成できるみたいやけ)
AudioLDM2やってみた♪(呪文はキャプションの)
🤗https://t.co/XiFRsNxhQ0 #text2music #AI作曲 https://t.co/tsMRVlZW89 pic.twitter.com/MeVWjhDu4V
・3D都市生成モデル
🔥🔥 We propose 🏙️CityDreamer🌆, a compositional generative model designed specifically for unbounded 3D cities.
— Ziwei Liu (@liuziwei7) September 5, 2023
- Project: https://t.co/6ha12s73DO
- Paper: https://t.co/6fCrv3MU2X
- Code: https://t.co/SYzXRNEZjm
- Demo: https://t.co/KRD0iLGGhZ https://t.co/qJppquSOSW pic.twitter.com/i677Ng9LB8
・激しすぎる日本語LLM開発状況
みてます。激しすぎる日本語LLM開発状況https://t.co/y8kezdpcVp#StockmarkTech pic.twitter.com/PdYIOM48Y9
— からあげ (@karaage0703) September 5, 2023
・Autiomatic1111 Web UI用ControlNet拡張がアップデート
Autiomatic1111 Web UI用ControlNet拡張がアップデートされ、SDXLの各種ControlNetに対応したようです。
— Kohya Tech (@kohya_tech) September 4, 2023
LLLiteも含まれており、対応いただいたlllyasviel氏に深く感謝します。https://t.co/a4Viu0QhNu
・一貫したvideo2videoのTokenFlow
一貫したvideo2videoのTokenFlow
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 6, 2023
プロジェクト: https://t.co/n55Vj4Rz2T
デモ: https://t.co/y0xQtN67LR
github: https://t.co/hxoikRYO7j https://t.co/eQjYmbRX8D pic.twitter.com/UZZsH4b7bw
・中国の検索大手バイドゥは、大規模言語モデルの新バージョンをまもなくリリースすると発表
・TIIのRefinedWebデータセットを用いて3兆5000億トークンを対象に学習させた、Falcon 180Bのデモ
https://twitter.com/akinoriosamura/status/1699440941302710518
・プロンプトだけで自然言語処理モデルを作成するフレームワーク「Prompt2Model」
プロンプトだけで自然言語処理モデルを作成するフレームワーク「Prompt2Model」が登場しました。
— AIDB (@ai_database) August 28, 2023
カーネギーメロン大などの研究グループによる発表です。
○ Vijay Viswanathan et al. Prompt2Model: Generating Deployable Models from Natural Language Instructions… pic.twitter.com/HN8srlX3kW
・prompt2modelという、プロンプトの手軽さとローカルに展開可能なモデルの利点を組み合わせた新しい研究/OSS
多くの開発者から
— Graham Neubig (@neubig) August 29, 2023
- LLMとの便利さはすごい!
- しかし、プライバシー、運用費用、コントロールの欠如には問題がある
そこでprompt2modelという、プロンプトの手軽さとローカルに展開可能なモデルの利点を組み合わせた新しい研究/OSSを開発しました。🧵 https://t.co/OvWAJy9sJk pic.twitter.com/UrT9Wemj0O
・明治大学、AIを活用した味の再現装置「TTTV3」を発表
明治大学、AIを活用した味の再現装置「TTTV3」を発表
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 7, 2023
- 産地や品種の違いを再現
- プロの料理人に匹敵する精密な味制御
- 20タンクに分かれた1000段階の味のタンクを制御して様々な味の組み合わせを再現
- 料理名を伝えるか料理画像を提供するだけで、味を推定して再現もhttps://t.co/iERkyM1yGc
・SLiMe: Segment like Me
SLiMe: Segment like Me
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 7, 2023
- 視覚言語モデルを活用し、1つのアノテーションサンプルを用いて、任意の粒度で画像セグメンテーション
- 他の既存のワンショットおよび少数ショットのセグメンテーション手法よりも優れていることを示す
(githubは見当たらない)https://t.co/iV26iL1q8l https://t.co/wJ4fkiPvKM pic.twitter.com/0OO5FpRdlZ
・8種類のがんを同時検出するAI画像診断モデル、アリババの最先端研究機関が発表
・自動運転EV開発のチューリング、日英言語対応のマルチモーダル学習ライブラリ「Heron」と最大700億パラメータの大規模モデル群を公開
気合入れたチューリング社独自の大規模モデルを公開しました! @ymg_aq @inoichan @tanahhh
— 青木 俊介 TuringのCTO (@aoshun7) September 7, 2023
是非使ってください!
自動運転EV開発のチューリング、日英言語対応のマルチモーダル学習ライブラリ「Heron」と最大700億パラメータの大規模モデル群を公開 https://t.co/UGLTFvmnWn @PRTIMES_JPより
・3Dコンテンツ作成のための統一フレームワーク「threestudio」のデモとGitHubリポジトリ
threestudio
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 7, 2023
デモ: https://t.co/Mg7G2mNNaG
github: https://t.co/mp1TpQOsBr
テキストプロンプト、単一画像、数枚の画像から3Dコンテンツを作成するための統一フレームワーク https://t.co/g1ySahHd5j pic.twitter.com/qDBV0DHQcR
・多様な役割のAIエージェント達に協力してソフトウェアを開発してもらう『ChatDev』登場
多様な役割のAIエージェント達に協力してソフトウェアを開発してもらう『ChatDev』登場。論文内容&使い方を解説https://t.co/exvOEULXzo
— AIDB (@ai_database) September 7, 2023
「夢が現実になった」「実際に使ってみたら面白かった」等の声が多く寄せられています。
研究の詳細と、ツールとしての動かし方やサンプルを記事化しました。
・複数のデータセットで評価された英語音声認識モデルを比較するOpen ASR Leaderboard
複数のデータセットで評価された英語音声認識モデルを比較するOpen ASR Leaderboardhttps://t.co/CE9XeFKG9q https://t.co/vVw75VeHmW pic.twitter.com/OwEnYNqeb1
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 8, 2023
・FLM-101B: オープンLLMと10万ドルで学習する方法
FLM-101B: オープンLLMと10万ドルで学習する方法
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 8, 2023
- LLMの課題: 計算コスト、公平で客観的な評価の難しさ
- 学習コスト削減戦略で、101BのLLMを10万ドルで学習
- 様々な評価で暗記による影響を最小限に
- GPT-3に匹敵する性能を達成
論文: https://t.co/oa10pMKwQ0
モデル: https://t.co/495ZjpnVLz https://t.co/mjBZGZK9sN
・分離されたビデオセグメンテーションによるあらゆるものの追跡
分離されたビデオセグメンテーションによるあらゆるものの追跡
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 8, 2023
- 個々のタスクごとにビデオを学習することなく、「何でも追跡」する
- タスク固有の画像セグメンテーションと、クラス/タスクにとらわれない双方向の時間伝搬から構成
PJ: https://t.co/wMgsikQW3g
github: https://t.co/I4JRhrzuxG https://t.co/JFMaYB0BbE pic.twitter.com/OrKSsxin1Y
・AIが「見た目に対する物理的感覚」を得ました。
AIが「見た目に対する物理的感覚」を得ました。
— AIDB (@ai_database) September 8, 2023
”変形しにくい容器はどっち?”
"壊れやすいのはどっち?"
などの問いに対して正確に答えます。
スタンフォード大学、DeepMind、プリンストン大学の研究チームが報告しました。
○ Jensen Gao et al. Physically Grounded Vision-Language Models for… pic.twitter.com/fiwv6OIsWN
・ProPainter:ビデオインペインティングのための伝搬とTransformerの改善
ProPainter:ビデオインペインティングのための伝搬とTransformerの改善
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 8, 2023
論文: https://t.co/MwT6Sws9Rz
github: https://t.co/5tI8lqsz37
(license NTU S-Lab License 1.0) https://t.co/ngibSmnvWt pic.twitter.com/B28gkloqeE
・OpenInterpreter / ついにAIがガチのアシスタントに!これは凄い、というか凄すぎる|shi3z
OpenInterpreter / ついにAIがガチのアシスタントに!これは凄い、というか凄すぎる|shi3z @shi3z #note https://t.co/9Fie8W5YG8
— shi3z (@shi3z) September 7, 2023