![見出し画像](https://assets.st-note.com/production/uploads/images/116899422/rectangle_large_type_2_1a8d0f8cef12d7eaf9e49e1e0bc75235.jpeg?width=1200)
【9/16-9/22】生成AI活用事例/研究開発-Weeklyまとめ
今週のAIに関する活用事例や研究開発情報の備忘録記事です。
活用事例
・Pictoriaがライブドアと連携し、AIキャラクターによるニュース配信を開始
【本日リリース✨】
— Pictoria公式 (@Pictoria_Inc) September 14, 2023
Pictoriaは、ライブドアと連携し「ライブドアニュース24」にて24時間365日ニュースを配信するAIキャラクターを開発いたしました!
本日β版が配信スタートです!
AIによるまったく新しいニュース番組、ぜひご覧ください!
詳細はコチラ▽https://t.co/YubR0Bz1fV
・生成AI Top 50
生成AI Top 50(by a16z)
— 久保田 雅也@ベンチャーキャピタル (@kubotamas) September 14, 2023
- トラフィック全体の6割がChatGPT
- Top50社の8割は1年以内の創業
- 利用モデルは独自LLM、ファインチューニング、一般LLMが3分の1ずつ
- Webがほとんど(モバイルは極少)
- 9割は売上有りで大半がサブスク https://t.co/CBRfj3aYJi pic.twitter.com/L22Nrtsalc
・IBMのWatsonxが新しい生成AIモデルとガバナンスツールを取得
IBMのWatsonxが新しい生成AIモデルとガバナンスツールを取得
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 14, 2023
- Llama 2 と Hugging Face の StarCoder をサポート
- 独自のビジネスニーズに合わせてモデルを調整できるチューニング スタジオ
- テストのための合成データジェネレーターも搭載https://t.co/HuoTtEC4xq
・動画生成AIのRunway、無制限利用と新機能を提供する制作者向けプログラムを発表
動画生成AIのRunway、無制限利用と新機能を提供する制作者向けプログラムを発表
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 15, 2023
- 一部のユーザーに対して「Runway Creative Partner Program」を開始すると発表
- 無制限プラン、100万クレジット、新機能への早期アクセスなどを提供https://t.co/BKzidBkxSC
・Amazon がGoogleなどに対抗し、ビジュアル検索、AR 検索など導入
Amazon がGoogleなどに対抗し、ビジュアル検索、AR 検索など導入https://t.co/XquUiurX8f pic.twitter.com/1PNskj0U9U
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 15, 2023
・BCG と Anthropic がクライアントに責任ある生成AIを提供するため提携
BCG と Anthropic がクライアントに責任ある生成AIを提供するため提携
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 15, 2023
- クライアントはAnthropicのAIを活用
- AnthropicのAIは、信頼性が高く、解釈可能で、コントロール可能
- 成長、効率性、イノベーションの主要な課題に関して、Claudeを使用したテストプログラムを促進https://t.co/emztKEIxhz https://t.co/wAzV4vkAYE
・UIをBootstrap、商用利用可能なAIを活用した生成型UIシステム
気になる。UIをBootstrap、商用利用可能なAIを活用した生成型UIシステム。
— しょーてぃー/Experience Designer (@shoty_k2) September 14, 2023
1. プロンプトを入力→3つのUI提案を行う。Shadcn UIとTailwind CSSに基づいて、コピペ可能なReactコードを生成。
2. UIは細かく調整可能。
AIを使用してUIを迅速かつ効率的に構築・立ち上げる。pic.twitter.com/5aWVCEi5l2 https://t.co/GsQimw6ctT
・開発者に高速、手頃な価格、カスタマイズ可能な大規模言語モデルを提供
生成AI Platform https://t.co/AfX2RUBV4r
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 15, 2023
開発者に高速、手頃な価格、カスタマイズ可能な大規模言語モデルを提供
オープンソースの基盤モデルを使用し、最大20-120倍のコスト削減で独自のLoRAアダプタをデプロイ可能https://t.co/Kv7sCn7tm7 https://t.co/qwyBZJ9Qn7
・Google、Google Cloud経由でGemini AIへのアクセスを試験的に開始
Google、Google Cloud経由でGemini AIへのアクセスを試験的に開始 https://t.co/aiQ0CeFi8S @datacentercafeより
— あるふ (@alfredplpl) September 18, 2023
・OpenAIがgpt-3.5-turbo-instructをリリース
gpt-3.5-turbo-instructがリリース pic.twitter.com/pIp2ocdgs4
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023
・MeshyAI自動テクスチャ機能
っていうMeshyAIの自動テクスチャ機能のことをnoteに追記しましたhttps://t.co/gNgUXobxOG
— nakashun / Witchpot (@nakashun_t) September 18, 2023
・ゲーム業界、生成AIで激変の兆し 圧倒的王者Steamに挑むEpic Games
ゲーム業界、生成AIで激変の兆し 圧倒的王者Steamに挑むEpic Games
— 新清士@(生成AI)インディゲーム開発者 (@kiyoshi_shin) September 19, 2023
アスキーにSteamでの生成AI使用をしたゲームのリジェクト問題を書きました。逆にEpicGamesが全面受け入れの判断をする理由や米のAI権利を巡る問題の解説です。https://t.co/qcLsDM4sFs
・Agility Robotics、年間1万台の人型ロボットを製造する準備が整う
Agility Robotics、年間1万台の人型ロボットを製造する準備が整うhttps://t.co/iocY3zYfMA
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023
・質問できるチャットボットだけではなく、3Dスキャンの点検の自動化なども出来る。
製造エンジニア向けのAIツール。
— Tetsuro Miyatake (@tmiyatake1) September 19, 2023
質問できるチャットボットだけではなく、3Dスキャンの点検の自動化なども出来る。https://t.co/LIWkqTiLwM pic.twitter.com/bfK7ST9NOm
・3D Gaussian Splatting の概要|npaka
3D Gaussian Splatting の概要|npaka @npaka123 #note https://t.co/4kQ1ifJKa2
— 布留川英一 / Hidekazu Furukawa (@npaka123) September 19, 2023
・GoogleのAIチャットボットが、Gmailの受信トレイやドライブのストレージで見つけた情報をもとに質問に答えることができるように
GoogleのAIチャットボットが、Gmailの受信トレイやドライブのストレージで見つけた情報をもとに質問に答えることができるようにhttps://t.co/i77sJyhQi5
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023
・元ファーウェイの天才エンジニア、工場作業も家事もできる人型ロボット発表。「コスト400万円に抑える」
元ファーウェイの天才エンジニア、工場作業も家事もできる人型ロボット発表。「コスト400万円に抑える」https://t.co/lE7fnLzhZw
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023
・Outschool教師を支援するAI搭載ツールを発表
Outschool教師を支援するAI搭載ツールを発表
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023
- Outschoolは、子供向けのアカデミック・クラスや興味に基づいたクラスを提供するオンライン学習プラットフォーム
- 生徒の進捗レポートを作成するツール、AIティーチングアシスタントを発表https://t.co/e23aFFQuNd
・TikTok、AIコンテンツに自動的にラベル付けする新しいツールと技術を発表
TikTok、AIコンテンツに自動的にラベル付けする新しいツールと技術を発表https://t.co/G3DImuNDKD pic.twitter.com/NEOe1k0T5a
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023
・Catch+Release、AIを活用したユーザー作成コンテンツの検索を開始
Catch+Release、AIを活用したユーザー作成コンテンツの検索を開始
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023
- 自然言語クエリでユーザー作成コンテンツを探せるAI搭載の検索
- 企業がマーケティングキャンペーン用にクリエイターコンテンツのライセンスを取得するのを支援https://t.co/KWQ9Z2oQ8P
・RunwayのGen:48
RunwayのGen:48
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 20, 2023
- 2日間のショートフィルムコンペティションhttps://t.co/kjwecd9NBb https://t.co/i0oll7GkFu
・接客教育を目的にしたロープレAIの実証実験開始
接客教育を目的にしたロープレAIの実証実験開始しました!https://t.co/2Xvy4TUfYf
— いとう!@AIを1日1つ作る (@itosinitosin123) September 19, 2023
・Shopifyより、iPhoneで簡単3Dモデル作成
Shopifyより、iPhoneで簡単3Dモデル作成
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 20, 2023
必要物
- 良い照明環境
- 商品周辺を360度撮影
- iOS 17と最新バージョンの@Shopifyアプリを使用したiPhone Pro
- 20分以内の待ち時間https://t.co/PmmBPrFFi1 https://t.co/NO9Fws5Qfm pic.twitter.com/LVxgCPVnfk
・SequoiaのAI x ヘルスケアのカオスマップ
SequoiaのAI x ヘルスケアのカオスマップ。https://t.co/iwPrIXSU6a pic.twitter.com/aRhAdsWCRq
— Tetsuro Miyatake (@tmiyatake1) September 20, 2023
・Amazonがカメラや画像認識を活用しない無人レジのシステムをローンチ
Amazonがカメラや画像認識を活用しない無人レジのシステムをローンチする。
— Tetsuro Miyatake (@tmiyatake1) September 20, 2023
各アイテムにRFIDタグが付いているので、お店を出るゲートを通る際に自動的にタグを読み込み、その後にクレジットカードもしくは手首認証によって支払いを行う仕組みとなる。https://t.co/5bhjTh9d5h pic.twitter.com/3EPd52uYPe
・生成AI x 医療
生成AI x 医療
— 久保田 雅也@ベンチャーキャピタル (@kubotamas) September 19, 2023
フロント
- 患者エンゲージメント。特に服薬アドヒアランス向上。薬の服薬や再診を促すメッセージや電話の自動化
- 医療ドキュメント作成。患者と医師のやり取りをEHR記入を自動化。システムオブレコードとしての強力なポジショニング
-…
・EY、顧客のAI導入を促進するプラットフォーム「http://EY.ai」をローンチ——独自LLMも近日公開
EY、顧客のAI導入を促進するプラットフォーム「https://t.co/vPKVUa8Th8」をローンチ——独自LLMも近日公開 https://t.co/5kUv0dNBvJ @thebridge_jpより
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 20, 2023
・Stayway、生成AIを活用した補助金クラウド提供に向け実証実験を開始
Stayway、生成AIを活用した補助金クラウド提供に向け実証実験を開始
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 20, 2023
- 小規模事業者持続化補助金の事業計画書作成の検証で、人より作成時間が100分の1
- AIによる補助金の比較検討や絞り込み、高品質な自動書類作成などを目指すhttps://t.co/dNyIWZitly pic.twitter.com/7hNsfvO0Y9
・OpenAIにファインチューニングUIが登場
OpenAIにファインチューニングUIが登場
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 20, 2023
- 数ヶ月後にはUIからチューニングを作成できるように
- 同時トレーニングの制限を1から3に増加 https://t.co/vQe52bFnxy pic.twitter.com/7ikvtFMkIt
・OpenAIからDALLE3が発表
OpenAIからDALLE3が発表
— hiromichi kamata (@kamata1729) September 20, 2023
・物体間の関係性やニュアンスなど複雑なプロンプトを反映
・chatGPT上で使えてインタラクティブな画像生成
・実在のアーティストの画風の画像は出さないように調整
DALLE3はChatGPTPlus向けに10月に公開予定https://t.co/P3oUVDYagM pic.twitter.com/L9QPcPEFjK
・数ヶ月前に発表された、StanfordとGoogle共著のGenerative Agents論文を独自改良しながら、世界最大のアイドルフェスで実験した話
弊社ながら、おもしろいテックブログです!
— Yuya Ishikawa / Gaudiy (@yuya_gaudiy) September 20, 2023
DAOの実現には、LLMがマストだと思っていて、その実験の話です。PluralityDAOの実現。
数ヶ月前に発表された、StanfordとGoogle共著のGenerative Agents論文を独自改良しながら、世界最大のアイドルフェスで実験した話。https://t.co/iJCClTjamT
・ShortwaveのAIアシスタント
ShortwaveのAIアシスタント
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023
- 自然言語クエリで受信トレイの検索が可能
- 例: "先週SaaSスタートアップについて話していたメールは何ですか?"
- 文章の改善、会話の要約、メールの簡潔化など
- カレンダーにアクセスすることで、会議の草案をスケジューリングhttps://t.co/GsFdBcIb9n
・JusticeText、公選弁護人の証拠書き起こしにAIを活用
JusticeText、公選弁護人の証拠書き起こしにAIを活用
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023
- ボディカム映像や取調べ動画などを書き起こす
- 弁護士がタイムスタンプ付きのメモを取ったり、ビデオクリップを作成したり、証拠を共有可能
- ChatGPT搭載のMirandaAIは、証拠開示について自由に質問可能https://t.co/jy3nmUuMmL pic.twitter.com/F0w1fBctq0
・元Meta AI副社長、AI学習アプリとチャットボット「Sizzle」を発表
元Meta AI副社長、AI学習アプリとチャットボット「Sizzle」を発表
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023
- 数学の方程式や単語問題の解答を段階的に生成する無料のAI学習アプリ
- 採点、ステップを再生成、1つの問題に対して複数の解答を表示、課題の写真をアップロードなど、4つの新機能を発表https://t.co/iWlkDSsQmJ pic.twitter.com/bkvR2k0lFQ
・Uber Eats、2023年後半にGoogleのPaLM2搭載のチャットボットをローンチへ
Uber Eats、2023年後半にGoogleのPaLM2搭載のチャットボットをローンチへ
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023
- 米国、英国、オーストラリア、カナダ向けに公開
- 最初は、お得な情報の発見、お気に入り料理を簡単再注文など
- その後、食事計画、食料品のセール発見、レシピから食材を注文などを計画https://t.co/wp1F5r46QL
・AmazonがAlexaに生成AIを近々採用
AmazonがAlexaに生成AIを近々採用
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023
- リアルタイム情報へのアクセス、スマートホームの効率的なコントロールなど
- 新モデルは、ボディランゲージや人のアイコンタクトやジェスチャーを考慮した体験を可能にhttps://t.co/rN1LJSKHjL
・GitHub Copilot Chatツールを個人向けに提供開始
GitHub Copilot Chatツールを個人向けに提供開始https://t.co/JIEukUV2fs pic.twitter.com/FoXydztKan
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023
・中国の動画サイトでAIがさまざまな機能を提供
【こぼれ話】中国でAIは早くもより身近に。ビリビリではコメント欄で動画の要旨をまとめるAIが登場し短くまとめ、快手はコメント欄でAIで生成した絵を投稿でき、ビリビリや抖音はAIアシスタントで動画検索など、今中国で動画サイトとAIはより密接になっている、という記事ですhttps://t.co/6pEkyR9dAM pic.twitter.com/kIey9t99UO
— 36Kr Japan@中国テック・スタートアップ専門メディア (@36krJ) September 21, 2023
・AI生成インフルエンサーが24時間稼ぎ続ける中国ライブコマース新事情
AI生成インフルエンサーが24時間稼ぎ続ける中国ライブコマース新事情
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023
- わずか数分の動画からAIが生成したもので、24時間年中無休で働き続けることができるhttps://t.co/qxDAEI09A6 pic.twitter.com/zcihA9AqJj
・動画からアニメーションを生成するAIサービスの比較
動画からアニメーションを生成するAIサービスの比較が面白い
— IVAN@AR × Marketing (@van_eng622) September 21, 2023
Move AIが一番動きが滑らかに見えるpic.twitter.com/SQaiMqYCCj
・日本初のAIタレントが誕生
【速報:日本初のAIタレントが誕生!】
— しんやん|AIツール×ChatGPT (@yesmanblog) September 10, 2023
伊藤園お~いお茶のCMで
日本初の『AI生成タレント』
が起用されました。
CMの表現方法として
老後の姿と現在の姿が描かれてるのも
AIとの相性ピッタリですね!
これを機に、日本でも
AIタレントの波が来るのかも🤔
みんなはAIタレントどう思う? pic.twitter.com/oYcHLu6VZv
・要約AIが効率化
>後処理時間が長い3つの業務領域 (お問い合わせ、ご意見・ご要望、介助申込) に対し、電話要約AIを利用すると後処理時間が18%〜54%効率化 https://t.co/OCkVSFk2vX pic.twitter.com/iUbXHNMxen
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023
・無料でGPT4越え!?ついに来たXwin-LM|shi3z
研究開発
・大規模言語モデルの因果推論能力をテストするベンチマークデータセットを提案
LLMに因果推論能力はあるか?https://t.co/Lamr15vAP3
— さくさくむら (@Sakkusakumura) September 14, 2023
大規模言語モデルの因果推論能力をテストするベンチマークデータセットを提案
17の既存の大規模言語モデルを評価
現状のモデルは因果推論能力が低いことがわかった
・自動運転に対するLLMの道徳的判断の傾向を調査
プレプリントです。自動運転に対するLLMの道徳的判断の傾向を調査しています。LLMと人間の傾向は大まかには一致しますが、顕著な違いがあるものもありました。また、人と比較するとLLMは揺るぎない判断を示す場合がありました。https://t.co/R53PQCapLz
— Kazuhiro Takemoto (@kztakemoto) September 14, 2023
・ドイツやスペインなどの研究者が新しい画像生成AI「Würstchen v2」をリリース
ドイツやスペインなどの研究者が新しい画像生成AI「Würstchen v2」をリリースした
— 小猫遊りょう(たかにゃし・りょう) (@jaguring1) September 14, 2023
使ってみたところ、二次元イラストには向いてないが、他の領域では質が高そう。Stable Diffusionよりも学習コストが大幅に少ないため、より多くの組織がこのようなモデルを学習可能とのことhttps://t.co/8HoQccybNZ pic.twitter.com/MGjn54esd3
・TECA: テキストガイドによる合成3Dアバターの生成と編集
TECA: テキストガイドによる合成3Dアバターの生成と編集
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 14, 2023
Github: coming soon
PJ: https://t.co/tpHoUYyvwM https://t.co/eL3aDWJj20 pic.twitter.com/yRe69xnc8U
・Soccer Sceneのための動的なNeRF
Dynamic NeRFs for Soccer Scenes
— AK (@_akhaliq) September 14, 2023
paper page: https://t.co/8KlWSFGU71
The long-standing problem of novel view synthesis has many applications, notably in sports broadcasting. Photorealistic novel view synthesis of soccer actions, in particular, is of enormous interest to the… pic.twitter.com/6sAhy9xxvC
・Gaussian SplattingのGitHubリポジトリ
https://t.co/oxuq7DevGP https://t.co/smokLQE2o3
— 逆瀬川 (@gyakuse) September 13, 2023
・アリババ、AIモデルTongyi Qianwenを一般公開
アリババ、AIモデルTongyi Qianwenを一般公開
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 14, 2023
- 近い将来オープンソース版を公開し、無料で商用利用できる
- ECプラットフォームのタオバオは、アリババのモデルを活用したQAをテスト中https://t.co/1a0L1huJEh
・Patronus AI が間違いが許容されない業界用の LLM 評価ツールを考案
Patronus AI が間違いが許容されない業界用の LLM 評価ツールを考案
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 14, 2023
- 製品を一般公開し、さらに 300 万ドルのシードラウンドを発表
- モデルがビジネス上の機密情報や不適切な出力を検出https://t.co/hq6tvvgIBA pic.twitter.com/vLoToAAlE0
・音声AIを開発するcoquiによる、音声合成モデルXTTIのモデルウェイトを公開
音声AIを開発するcoquiによる、音声合成モデルXTTIのモデルウェイトを公開
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 14, 2023
- 3秒クローニング
- 多言語音声合成
- クロス言語音声クローニング
- 24khz
デモ: https://t.co/qt7SsuWJHw
モデル: https://t.co/c3hu8smSk9 https://t.co/LVOWjFtbGr
・Gaussian-Splatting をUnityで動かす記事
Gaussian-Splatting をUnityで動かす記事を書きました!!
— Aster@NeRFを広める人 (@Aster_NeRF) September 14, 2023
サンプルデータも込みなので,是非やってみてください!!!
|aster https://t.co/eBFOk0QcKP #zenn #Unity #NeRF #3DGS #GaussianSplatting #3DScan
・RETFound: 網膜画像からの汎化可能な疾患検出のための基盤モデル
RETFound: 網膜画像からの汎化可能な疾患検出のための基盤モデル
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 15, 2023
- 160万枚のラベル無し網膜画像に対して自己教師あり学習により汎化可能な表現を学習
- 疾患検出タスクに対し、少ないラベル付きデータで複数の比較モデルを凌駕https://t.co/3QEmGPV53j
・MS、タンパク質生成AI「EvoDiff」をオープンソース化
MS、タンパク質生成AI「EvoDiff」をオープンソース化
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 15, 2023
- タンパク質配列があれば「忠実度高く」「多様な」タンパク質を生成できる
- ターゲットタンパク質の構造情報を必要としないため、通常最も手間のかかる部分を省くことが可能
github: https://t.co/0eOapFcBuo
記事: https://t.co/BO1UT5BAVL
・IBMが、MoLMのオープンソースを発表
IBMが、MoLMのオープンソースを発表
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 15, 2023
- MoE(Mixture of experts)ベースの言語モデルのコレクション
- 40億から80億のパラメータを持つhttps://t.co/hxsamBPllB https://t.co/lGNz4oDBah
・画像をダイナミックな動画に変えたり、物体とインタラクションできるようにするなど
Generative Image Dynamics
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 15, 2023
画像をダイナミックな動画に変えたり、物体とインタラクションできるようにするなど
論文: https://t.co/kooR0JQLLX
demo: https://t.co/roqL5grnMS https://t.co/J3pqDAQgjO pic.twitter.com/NaWxfdFtYP
・SyncDreamer:シングルビュー画像からマルチビューの一貫した画像
SyncDreamer:シングルビュー画像からマルチビューの一貫した画像
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 15, 2023
のコードとデモが公開
github: https://t.co/NKTdEE8kWu
demo: https://t.co/ZVkKiXlqlI https://t.co/nwamTyXDWS pic.twitter.com/w4mkpSsPlc
・自動運転でAIの考え方を示すモデルLINGO-1
自動運転でAIの考え方を示すモデルLINGO-1が面白い。
— Tetsuro Miyatake (@tmiyatake1) September 16, 2023
何を見ていて、次の3秒間でどういうアクションを何故取るのかを解説してくれる。
モデルの説明を行うシステムは今後大事になる気がする。https://t.co/UJZn4uYygF pic.twitter.com/t9k3tCeqd8
・BCGとハーバードやMIT等によるGPT4を使用したタスク実験
BCGとハーバードやMIT等によるGPT4を使用したタスク実験
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 18, 2023
- BCGのコンサルティング758名で実験
- 18種類のコンサルタスクが対象
- AIを使用したコンサルは 、12.2%多く仕事を終え、 25.1%早く仕事を完了し、 40%高い品質
記事: https://t.co/vItoLQamhv
paper: https://t.co/6IT6F5XAGE https://t.co/2OADqpnuWG pic.twitter.com/VvoNRDzrtc
・自律言語エージェントのためのオープンソースフレームワーク
自律言語エージェントのためのオープンソースフレームワーク
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023
- 短長期記憶、ツール使用、Web、マルチエージェント通信などを含む機能をサポート
- 自然言語で設定ファイルを埋めるだけでシステムをカスタマイズ
- ターミナル、Gradio、バックエンドなどにデプロイ
github: https://t.co/LgG5fjIHtL https://t.co/I7rY7fLoab pic.twitter.com/gJw68pOj9Y
・LayoutNUWA:大規模言語モデルの隠れたレイアウト専門知識を明らかに
LayoutNUWA:大規模言語モデルの隠れたレイアウト専門知識を明らかに
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023
- レイアウト生成をコード生成タスクとして扱いレイアウト生成のパフォーマンスを大幅に向上
- 大規模言語モデルに内在するレイアウトの専門知識を効果的に利用
github: https://t.co/BZjZSRPgKR
論文: https://t.co/zFfOWKmxpF https://t.co/nu3ST6qnEo pic.twitter.com/I6KhPD9Hnf
・CulturaX:167言語、6.3兆トークンの大規模言語モデルのための、クリーンで膨大な多言語データセット
CulturaX:167言語、6.3兆トークンの大規模言語モデルのための、クリーンで膨大な多言語データセットhttps://t.co/foFN9mB5c8 https://t.co/iDvJX44jfJ
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023
・Flash Attentionを使ったLLMの推論の実験
Flash Attentionを使ったLLMの推論の実験が丁寧に解説されている。
— m__k (@m_k_696) September 19, 2023
Flash Attentionを使ってLLMの推論を高速・軽量化できるか? https://t.co/r2Id7x8qWf #Qiita
・なぜ日本はGPUのない「富岳」でLLMを研究するのか 外国に後れを取らないための“現実的な理由”
『開発したLLMは最終的にGitHubやHugging Faceで公開するが』マジで?神
— Torishima (@izutorishima) September 18, 2023
なぜ日本はGPUのない「富岳」でLLMを研究するのか 外国に後れを取らないための“現実的な理由” https://t.co/qmxhdMOu1a
・自律言語エージェントを構築するためのフレームワーク Agents を試す|npaka
自律言語エージェントを構築するためのフレームワーク Agents を試す|npaka @npaka123 #note https://t.co/HSH5Weqvz4
— 布留川英一 / Hidekazu Furukawa (@npaka123) September 19, 2023
・Google DeepMindのAlphaFoldがミスセンス突然変異の病原性を89%の精度で予測
GoogleDeepMind がAlphaFold を微調整し、ヒトのタンパク質の機能に影響を与える可能性がある遺伝子変異、「ミスセンス突然変異」の病原性や良性を予測するAlphaMissenseを発表。
— bioshok(INFJ) (@bioshok3) September 19, 2023
7,100 万のミスセンス変異体の内人間の専門家によってはわずか 0.1% が分類されていたが、今回89%を分類。 https://t.co/7mz2ViCsyb
・OpenAI Red Teaming Networkの公募を発表
OpenAI Red Teaming Networkの公募を発表
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 20, 2023
- OpenAI モデルの安全性を向上させることに関心のあるドメインエキスパートの参加を呼びかけhttps://t.co/X4dZfpCDrt https://t.co/YVOCJntATt pic.twitter.com/RCwfQ2FfXj
・MSより、視覚言語能力を持つマルチモーダル基盤モデルの分類と進化についてのサーベイ論文
MSより、視覚言語能力を持つマルチモーダル基盤モデルの分類と進化についてのサーベイ論文
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 20, 2023
- 専門モデルから汎用アシスタントへの移行に焦点https://t.co/gqnJxwVzqB https://t.co/TumupnODrv pic.twitter.com/WWOfNptn4q
・各LLMの精度評価を支援するスタートアップの台頭
各LLMの精度評価を支援するスタートアップの台頭
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 20, 2023
Martianなどhttps://t.co/piR2wY58hQ
・マルチリンガルな言語モデル入門
多言語の呪い(curse of multilinguality):多言語モデルに混ぜる言語数を増やしていくとあるところまでは性能が上がるが、それ以降は性能が下がる
— Seitaro Shinagawa (@sei_shinagawa) September 20, 2023
という話があるらしいので、日本語LLMを強化するのに英語以外の他の言語混ぜると性能上がるかは試す価値ありそう?https://t.co/TQYZFtdo6H
・ControlNet-XS
ControlNet-XS
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 20, 2023
- ControlNetのサイズとアーキテクチャ設計を調査
- FIDスコアでControlNetよりも優れた結果を達成
- StableDiffusion-XLとStableDiffusion 2.1を制御するコードをopenrailライセンスで提供
論文, github, モデル: coming soon
PJ: https://t.co/Mow6tj8AMK https://t.co/yIZthPKt5M pic.twitter.com/hqnJrP1wMa
・ローカルLLM のリリース年表|npaka
ローカルLLM のリリース年表|npaka @npaka123 #note https://t.co/GPGEzK4Dwt
— 布留川英一 / Hidekazu Furukawa (@npaka123) September 20, 2023
・GPT-4を上回るオープンなLLM誕生? 中国研究者らが「Xwin-LM」公開
GPT-4を上回るオープンなLLM誕生? 中国研究者らが「Xwin-LM」公開https://t.co/HZiUv67Xf0
— ITmedia NEWS (@itmedia_news) September 20, 2023
・検証の連鎖が大規模言語モデルの幻覚を減らす
検証の連鎖が大規模言語モデルの幻覚を減らす
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023
(1)最初の応答を起草
(2)検証のための質問を計画し、回答
(3)最終的な検証済みの応答を生成https://t.co/OhVsVJDAez https://t.co/0ITpk7RtRC pic.twitter.com/kuM8fsgMZp
・音声言語表現学習のための大規模データセット
音声言語表現学習のための大規模データセット
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023
- 公開ツールやAPIに基づく自動音声キャプション生成パイプラインを提示
- 190万以上の音声テキストペアからなる、Auto-ACDと名付けられた大規模で高品質な音声言語データセットを構築
PJ: https://t.co/rQmzaF7ouD https://t.co/KV4s9kTO61 pic.twitter.com/mA9mpIEzzW
・SceneDreamerの学習コードと、中で使われているseg2imageモデル(SPADE)へのアクセスが公開
SceneDreamerの学習コードと、中で使われているseg2imageモデル(SPADE)へのアクセスが公開https://t.co/LXaA2WSEWX https://t.co/A7YfGQHJjW pic.twitter.com/Dptm4hdVaq
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023
・FreeU: 数行のコードで生成品質を改善
FreeU: Free Lunch in Diffusion U-Net
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023
- Stable Diffusion、DreamBooth、ModelScope、Rerender、ReVersionに統合でき、数行のコードで生成品質を改善
PJ: https://t.co/p0oH6SMLaq
github(紹介のみ): https://t.co/lEnlNzuaKL https://t.co/Hl1f5PrE3H pic.twitter.com/iI3jgfZZyk