
【9/23-9/29】生成AI活用事例/研究開発-Weeklyまとめ
今週のAIに関する活用事例や研究開発情報の備忘録記事です。
活用事例
・YouTubeがAIツールを多数発表
YouTubeは数々のAIツールを発表
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023
- AIが生成する写真や動画の背景、AIによる動画トピックの提案、音楽検索などhttps://t.co/AdVE4T9sUL pic.twitter.com/xLK59nlYjb
・Microsoft 365 Copilotが11月にローンチ
Microsoft 365 Copilotが11月にローンチ
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023
- 365ユーザーは11月1日からCopilotに加入可能
- 1人当たり月額30ドル
- 文書要約、メール作成委託、他のファイル情報から新しいWordプロジェクト作成、Teamsミーティングのハイライトをリアルタイム表示などhttps://t.co/YnQwDAxu0C
・Microsoftは、Bing ChatにDALL-E 3を近々追加
Microsoftは、Bing ChatにDALL-E 3を近々追加
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023
- また、新しいショッピング機能も追加
- ユーザーに製品の使用方法に関する質問や、よりパーソナライズされた質問を投げかけることが可能https://t.co/Uzb7E5OI5K
・中国のAIライバーの価格と料金体系について
中国のAIライバーに関して16万円で使えると思われているので正しい情報をシェアします
— 吉川真人🇨🇳深センスタートアップ起業🔥 (@mako_63) September 21, 2023
•分身だけなら16万円程度
•音声クローンは30万円or100万円(音声のクオリティで変動)
•年間費用4万円
•一定の動画生成の時間に達すると従量課金制に変化… pic.twitter.com/e2Mvyi9c3K
・LLM開発のSpiral.AI、真島なおみと音声&チャットで擬似会話できる「Naomi.AI」ローンチへ
LLM開発のhttps://t.co/e6tkhcjLnj、真島なおみと音声&チャットで擬似会話できる「https://t.co/rPvizFY43H」ローンチへ https://t.co/oDyzpkQLn9 @thebridge_jpより
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 22, 2023
・ドイツ銀行AI帝国への野望
ドイツ銀行AI帝国への野望🔥
— 久保田 雅也@ベンチャーキャピタル (@kubotamas) September 23, 2023
- 300-400名のAIエンジニアを1年以内に2-3倍に
- 13名の業務執行役員全員で全社にまたがり推進
- 若手バンカーが2-3日かかる資料を秒で作るツールや法人顧客の相談チャットボット等が登場
- 現在25のPoC推進中で2024年に大量投入の見込みhttps://t.co/b8LBUVA3Ha
・ゲーム開発に生成AI 新興、コスト3分の1に - 日本経済新聞
ゲーム開発に生成AI 新興、コスト3分の1に - 日本経済新聞 https://t.co/puUgBMshEC
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 23, 2023
・GPT/生成AIのSaaSインパクト、業務変革を知りたいなら Salesforceの各Keynoteをみればパクれるポイント満載!
GPT/生成AIのSaaSインパクト、業務変革を知りたいなら Salesforceの各Keynoteをみればパクれるポイント満載!
— 尾原@NHK Eテレ令和ネット論「中国デジタル最新事情」8/30(水) 22:00~ 見てちょ (@kazobara) September 24, 2023
営業(Sales), マーケ(Marketing)、コマース(Commerce)、顧客対応(Service)他、タブロー、Slack、Mulesoftなど 自社に近いところのKeynoteを見れば、生成AI,…
・京丹後中学校、AIを活用した英会話学習を導入
京丹後 中学校で生成AI活用した英会話学習 導入へ|NHK 京都府のニュース https://t.co/cZmlBIBGRW
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 25, 2023
・AR Code Object Capture Appの最新デモ
AR Code Object Capture Appの最新デモ
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 25, 2023
綺麗にくら寿司が
アプリ: https://t.co/aY9EFzjK0e https://t.co/euYey4IfIH pic.twitter.com/QVCnK3PD45
・ChatGPTが音声会話と画像の利用を可能に
ChatGPTが、見て、聞いて、話せるように
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 25, 2023
- 今後2週間でChatGPT Plusユーザーに公開
- 音声会話(iOS & Android)
- 会話に画像を含めるられる(すべてのプラットフォーム)https://t.co/j4PHWxo5Yf https://t.co/Dz9CnNTAIy pic.twitter.com/d2mdRkVsgx
・SpotifyはOpenAIと提携し、ポッドキャスターが自分の声を複製し、番組を自動翻訳できるように
SpotifyはOpenAIと提携し、
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 25, 2023
ポッドキャスターが自分の声を複製し、番組を自動翻訳できるようにhttps://t.co/bpEGwtFaHH
・商用利用が可能なAIアート用、画像生成AI「Emi」を無償公開
商用利用が可能なAIアート用、画像生成AI「Emi」を無償公開いたしました!
— AI Picasso@AIアバター (@AIPicassoApp) September 25, 2023
リリース内容はこちら👇https://t.co/Ve9FUpXYaz
✨特徴✨
・AIアートに特化
・商用利用可能
Emi: https://t.co/EBVTb3nHnE
また、「Manga Diffusion」の概念実証版も公開しましたので、ぜひお試しください。
Manga… pic.twitter.com/RbbyMuGUVK
・Getty ImagesとNvidiaが提携し、画像生成ツールをリリース予定
画像素材サイトのGetty ImagesがNvidiaと提携し、画像生成ツール「Generative AI by Getty Images」をリリース予定
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 26, 2023
- Getty Imagesの膨大な画像を活用
- ライセンス画像のみを対象
- 最終的に独自データでチューニングできるようにhttps://t.co/OqDa4A7H0r
・ShopifyからSDXLの背景置換
ShopifyからSDXLの背景置換デタ!
— forasteran (@forasteran) September 26, 2023
昨日のFreeUした #Fuduki_mix のバーの子をモルジブに行かせてみたw
SDXL Background Replacement for Product Imageshttps://t.co/gXOcSxHT2V
商品や衣装(着た人)撮ったら、呪文で背景変えられるやつや!広告に使われてくんかなhttps://t.co/V8sZVQDpyk pic.twitter.com/9qRzA0vpOs
・SAPが、AIアシスタント「Joule」を発表
SAPが、AIアシスタント「Joule」を発表
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 27, 2023
- 複数のシステムのデータに対しQ&Aしたり、インサイトを抽出など
- 例えば人事では、職務記述書の作成、適切な面接質問の生成などを支援https://t.co/LjIGC993UO pic.twitter.com/iLnQ4CD3PS
・⻭学部学⽣試験⾃動⽣成アプリ「EQIO」
⻭学部学⽣試験⾃動⽣成アプリ「EQIO」/Monthly Pitch! スタートアップの扉
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 27, 2023
- ⻭科医師の作問業務をサポートする⻭学部学⽣試験⾃動⽣成アプリ
- 100問を数秒で作成https://t.co/zqlaL8qXeI
・CIA、中国に対抗して独自の人工知能ツールを構築
CIA、中国に対抗して独自の人工知能ツールを構築
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 27, 2023
- ChatGPTと似た機能を展開予定
- アナリストがオープンソースの情報にアクセスしやすくhttps://t.co/tXUys5LWOj
・ハーバードによる、学生のAI利用例ガイドライン
ハーバードによる、学生のAI利用例ガイドライン
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 27, 2023
以下、4つに関しての記事が記載
- フィードバック生成器としての AI
- 家庭教師としてのAI
- チームコーチとしてのAI
- 学習者としてのAIhttps://t.co/klXMbBYum0
・GPT-4を使用した視覚障害者向けのサービス「Be My AI」が展開
ようやくGPT-4を用いた視覚障害者向けのサービス「Be My AI」が、世界にいる数十万人のiOSユーザーに向けて今後数週間で展開されていく
— 小猫遊りょう(たかにゃし・りょう) (@jaguring1) September 27, 2023
盲導犬の代わりや医療目的などの生死に関わるような使用はまだ避けるべきだが、24時間365日、いつでも視覚的な支援を得られるようになるhttps://t.co/7muzzE6iu8
・AIキャラクターとの会話が可能なWebサービス「EFILIA」のβ版がリリース
【本日リリース✨】
— Pictoria公式 (@Pictoria_Inc) September 27, 2023
Pictoriaは、AIキャラクターと1対1でお話ができるWebサービス「EFILIA(エフィリア)」のβ版をリリースいたしました!
感情豊かなAIキャラとの会話をお楽しみください!
β版では『魔法少女アイマイン @AiMain_aicast』の2人とお話できます。
詳細はこちらhttps://t.co/wkzvq8OhVx
・画像生成AI「ideogram v0.1」が1ヶ月で110万ユーザーを獲得し、7,500万枚以上の画像を生成
画像生成AI「ideogram v0.1」の一般公開からわずか1ヶ月で110万ユーザーを超え、7,500万枚より多くの画像を生成した。
— 小猫遊りょう(たかにゃし・りょう) (@jaguring1) September 27, 2023
Ideogram AIはグーグルの画像生成AI「Imagen」や動画生成AI「Imagen Video」などを開発した人たちが立ち上げた企業で、拡散モデルで世界に衝撃を与えたHo氏もいて注目を集めている https://t.co/CpA48iAtqH
・MetaがAI画像生成技術「Emu」をローンチ
MetaがAI画像生成技術「Emu」をローンチ。
— Tetsuro Miyatake (@tmiyatake1) September 28, 2023
他社と違って5秒で画像生成できるとのことで、メッセージ用に使われることを想定している。 pic.twitter.com/cN3uvJmlsC
・Instagram創業者のArtifactがAIニュースアプリに投稿機能を追加し、Twitterとの競争が激化
Instagram創業者が立ち上げたAIニュースアプリのArtifactが投稿する機能を導入したので、今まで以上によりTwitterと競合するようになる。https://t.co/fgUohrNRRR pic.twitter.com/2b4TPjZsmE
— Tetsuro Miyatake (@tmiyatake1) September 28, 2023
・Metaの次世代スマートメガネにはマルチモーダルなAIとライブ配信機能が搭載
Metaの次世代スマートメガネではマルチモーダルなAIが導入されている。
— Tetsuro Miyatake (@tmiyatake1) September 28, 2023
さらに音楽を聴けたり、電話をするだけではなく、ライブ配信ができる。 pic.twitter.com/BsfKKkjj8x
・MetaのChatGPT的なAIチャットボット機能「Meta AI」
MetaのChatGPT的なAIチャットボット機能「Meta AI」。
— Tetsuro Miyatake (@tmiyatake1) September 28, 2023
Bing検索と提携してリアルタイム情報を提供できるとのことで、画像生成技術も含まれている。
全てのMetaアプリに導入されるので、普及率はどのAIサービスよりも凄そう。 pic.twitter.com/Q08leaCTnO
・MetaがAIチャットボットをより簡単に開発できるプラットフォーム「AI Studio」ローンチ
MetaがAIチャットボットをより簡単に開発できるプラットフォーム「AI Studio」ろローンチ。
— Tetsuro Miyatake (@tmiyatake1) September 28, 2023
Off Topic AIを作ってみたい。https://t.co/AP7j3z70jW
・ChatGPT x Bingブラウジングの復活
ChatGPT x Bingブラウジングの復活 https://t.co/BBDaj9Tvw3
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 28, 2023
・GPT-4Vでできること24選
GPT-4Vでできること24選
— Yota Ishikawa | AI (@ytiskw) September 28, 2023
ついに、ChatGPTに視覚(目)がつきます。
私はまだGPT4V来ないので悶えています🙄🙄
代わりに厳選した24個の事例をスレッドにまとめました
↓↓↓
・Google Colab で Preferred Networks の PLaMo-13B を試す|npaka
Google Colab で Preferred Networks の PLaMo-13B を試す|npaka @npaka123 #note https://t.co/pNqrewQ4Og
— 布留川英一 / Hidekazu Furukawa (@npaka123) September 28, 2023
・Stable Diffusion Ultimate Upscale (21956 x 32000) by u/ataylorm
Stable Diffusion Ultimate Upscale (21956 x 32000) by u/ataylorm pic.twitter.com/ISkWOXTKwb
— AK (@_akhaliq) September 28, 2023
・FreeUのデモ
FreeU’s demo is now available https://t.co/9fsG6JsCkl. https://t.co/xUNzD6mTt5 pic.twitter.com/FdYeR05Iny
— scy (@scy994) September 28, 2023
・AWS提供の生成AIサービスが一般開放 新たにLlama 2も利用可能に
AWS提供の生成AIサービスが一般開放 新たにLlama 2も利用可能に
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 29, 2023
- 生成AIをAPI経由で利用できるサービス「Amazon Bedrock」の一般提供を開始
- Amazon Titan、Claude 2、Jurassic-2、Stable DiffusionなどをAPI経由で利用可能
- Llama 2も近日中に対応予定https://t.co/eI115oMdEK
・DreamGaussian
DreamGaussianを試す。
— 布留川英一 / Hidekazu Furukawa (@npaka123) September 29, 2023
無料Colabで5分ほどで完成。https://t.co/gpMg2mqgXG pic.twitter.com/G1S75btpXc
研究開発
・LLMの個別の性格(人格)特性を、プロンプトで「測定」「形成」する手法
LLMの個別の性格(人格)特性を、プロンプトで「測定」「形成」する手法https://t.co/vxC0FJIcan
— AIDB (@ai_database) September 21, 2023
DeepMindや慶應などによる研究です。
この研究に対しては、好奇心を強く刺激される方が多く、今後に期待する声が寄せられています。
性格の形成を行うプロンプトの例を掲載した記事を公開しました。
・チャットシステムを開発しているForethoughtが、自然言語でワークフローを構築するAutoflowsを発表
チャットシステムを開発しているForethoughtが、自然言語でワークフローを構築するAutoflowsを発表
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 22, 2023
- 単に質問に答えるだけでなく、一連のタスクに取り組み、システムを横断して完了させる
- 既にベータ版はリリースhttps://t.co/RXVrklGDdA
・Transformerの後継を謳ってたRetNetがViTに適用されてちゃんと結果が出ましたよ論文
Transformerの後継を謳ってたRetNetがViTに適用されてちゃんと結果が出ましたよ論文
— はまなすなぎさ (@RosaRugosaBeach) September 22, 2023
PixelCNN系みたいに画像を左上から読み取る形式かと思ったらRetNetをちゃんと平面+双方向に拡張していて偉い(自己回帰で過去しか見れないのは画像認識とかには適してないと言ってる)https://t.co/gQs8aXwuWa
・Generative Agentの内部実装を公開
MESONではAIにも力を入れています。その流れで、弊社のエンジニアが、先日公開された「Generative Agent」の内部実装を読み、概観できるように内容をまとめてくれました! GPTをただ質問に使うだけでなく、どんどん活用していきたいですね。https://t.co/1HDAohfrJP#AI #GPT
— edom18@XR / MESON CTO (@edo_m18) September 20, 2023
・無料でGPT4越え!?ついに来たXwin-LM|shi3z
無料でGPT4越え!?ついに来たXwin-LM|shi3z @shi3z #note https://t.co/sr9cfqOcaJ
— shi3z (@shi3z) September 22, 2023
・経産省が基盤モデルの開発に必要な GPU を含む計算リソースの提供とその利用料の助成という形で支援。大学等は定額、営利企業は1/2助成
経産省が基盤モデルの開発に必要な GPU を含む計算リソースの提供とその利用料の助成という形で支援。大学等は定額、営利企業は1/2助成。https://t.co/IgvWcoKrfI
— Y. Kawahara (@mahimahi) September 22, 2023
・GPUを低コストで運用する方法についての発表資料
GPUをつかったインフラを低コストで運用することをテーマにした発表を行いました。
— Kai INUI (@_kaiinui) September 23, 2023
AWS/GCPのGPUと本体価格の比較、代替サービス、サーバレスGPU、自前ホスティングのオプションを比較した上で、GPUを含めた自前物理ホスティングを楽に安く行う方法を提案しています。
資料: https://t.co/cQ4cZjzms8 pic.twitter.com/8BLxTbdlkj
・新画像生成AIのDALL-E 3は何ができるのか?
✅DALL-E 3の概要
— IT navi (@itnavi2022) September 22, 2023
✅DALL-E 3とMIdjourneyの生成画像の比較
✅ChatGPTとの連携
新画像生成AIのDALL-E 3は何ができるのか?https://t.co/PUpMvWFw5j
・FreeUコードのリリース
We have released the FreeU code. https://t.co/BwVLQ1SMIZ https://t.co/xUNzD6nriD
— scy (@scy994) September 22, 2023
・Googleは、LLMを活用して「非構造化文書(例えばレシートなど)」から高精度にテキストを抽出するOCR『LMDX』を発表
Googleは、LLMを活用して「非構造化文書(例えばレシートなど)」から高精度にテキストを抽出するOCR『LMDX』を発表しました。
— AIDB (@ai_database) September 23, 2023
BardとGoogle drive等との連携をさらに強化する可能性のある技術です。
○ Fernanda De La Torre et al., "LMDX: Language Model-based Document Information Extraction… pic.twitter.com/XhWPd88l9A
・Snapchatが商品画像から価格を鑑定する技術の特許申請を行う
Snapchatが商品画像から価格の鑑定が出来る技術の特許申請を出した。
— Tetsuro Miyatake (@tmiyatake1) September 25, 2023
Snapカメラを使ってポケモンカードを見せるとどれぐらいレアで価格を調べられる。https://t.co/C5ay6CzdBa pic.twitter.com/fClWtsGgrT
・量子化が枝刈りよりも効率的で精度が高いことが実験結果で示される
NNの効率/精度において枝刈りと量子化のどちらが優れているか理論解析、実験結果で比較し、量子化が常に優れていることが示された。しかも、比較に使った枝刈りは非構造化枝刈りでありHWで性能が出せる構造化枝刈りではさらに制約があるため差が大きくなる。https://t.co/jFPP7VXj6G
— Daisuke Okanohara / 岡野原 大輔 (@hillbig) September 24, 2023
・LLMを用いたAIの自動評価について
AIがAIを評価。奇妙な感覚ですね > LLMを用いたLLMの自動評価について 〜可能性と注意点〜 - NTT Communications Engineers' Blog https://t.co/hFMz2AW1TP
— からあげ (@karaage0703) September 25, 2023
・Algomaticは独自LLM開発
Algomaticは独自LLM開発していきます!
— 大野峻典 | Algomatic CEO (@ono_shunsuke) September 25, 2023
LLMの利活用が進む一方で、既存のLLMでは解決できない課題も明らかになってきました。そうした技術進化と人々の生活に与える実利益のギャップを埋めるべく、独自LLMを開発していきます!
LLM開発にご興味ある方、ご連絡ください〜https://t.co/S4sRChZ7CV
・MosaicFusion
MosaicFusion
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 25, 2023
- 学習不要の拡散ベースのデータセット増強パイプライン
- テキスト画像生成モデルを用いて、複数のオブジェクトを含む画像とマスクのペアを同時に生成
論文: https://t.co/OoJIzYWHpq https://t.co/kokCvV5a18 pic.twitter.com/l5efJWFOrf
・Open AIがGPT-4V(ision)のシステムカードをリリース
Open AIがGPT-4V(ision)のシステムカードをリリース
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 25, 2023
- GPT-4Vの安全特性を分析https://t.co/NtEqkzlT65 https://t.co/oL9YqjuoLq
・ELYZAが公開した日本語LLM「ELYZA-japanese-Llama-2-7b」についての解説
【お知らせ】ELYZAの技術ブログ記事を公開しました。ELYZAが公開した日本語LLM「ELYZA-japanese-Llama-2-7b」についての解説、第2弾です。
— ELYZA, Inc. (@ELYZA_inc) September 26, 2023
モデル評価データやその妥当性、自動化の余地などを深掘りしています。内容は以下リンク先をご覧ください。https://t.co/ii42w3VMY4
・ファーウェイクラウド、自動車と医療分野向けの大規模言語モデルを発表
ファーウェイクラウド、自動車向け・医療向けの大規模言語モデルを発表
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 26, 2023
- 自動車: 自動車の設計や生産、マーケティング、研究開発などをカバー。
- 医療: 学術誌などのデータや、100万以上の構造化されたナレッジグラフなどで学習。4000の病院に導入され、医師をサポート予定https://t.co/NQrOkISW3N
・清華大学発スタートアップ、“創薬版ChatGPT”「ChatDD(Drug Design)」を発表
清華大学発スタートアップ、“創薬版ChatGPT”「ChatDD(Drug Design)」を発表 新薬開発の効率向上へ
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 26, 2023
- 創薬プロジェクトの立案、前臨床研究および臨床試験の全段階をカバーし、創薬専門家のアシスタントとして新薬開発の効率を向上https://t.co/gGsSlgn2Rs
・アリババクラウド、世界のLLM開発者や企業向けにAI新サービスを発表 米レッドハットとの提携も強化
アリババクラウド、世界のLLM開発者や企業向けにAI新サービスを発表 米レッドハットとの提携も強化https://t.co/2Uj0dlCHXY
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 27, 2023
・VideoDirectorGPT:LLMガイド付きプランニングによる一貫したマルチシーン映像生成
VideoDirectorGPT:LLMガイド付きプランニングによる一貫したマルチシーン映像生成
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 27, 2023
- テキストプロンプトが与えられると、ビデオプランナーLLM(GPT-4)がプランを展開
- 動画ジェネレーターのLayout2Vidが、レイアウトと動きの一貫性を維持し生成
論文: https://t.co/y5bxzBvMKM https://t.co/UbH78DW2Jl pic.twitter.com/iX4eRfl0Au
・LLMの推論能力向上に貢献するフレームワーク『LogiCoT』が発表
GPT-4などのLLMに「自らの論理的な整合性をチェック」させるフレームワーク『LogiCoT』が発表されました。
— AIDB (@ai_database) September 27, 2023
CoTをさらに発展させた内容で、推論能力の向上が検証されています。
○ Xufeng Zhao et al., "Enhancing Zero-Shot Chain-of-Thought Reasoning in Large Language Models through Logic"… pic.twitter.com/e5LUULq4e6
・Open Interpreter's Generatorが大幅にアップデート
●
— killian (@hellokillian) September 26, 2023
Open Interpreter's Generator Update came out today.
it's our biggest update by far.
- You can build Open Interpreter into your apps
- 100+ new LLMs supported, including Claude
- Custom settings, custom instructions
- Set spending limits
- Resume chats
↓ pic.twitter.com/Zc0I0yOHt7
・中国チームが新しい画像修復技術「DiffBIR」を発表
モザイク外し? 汚い画像をキレイな画像に修復手法、中国チームが発表 Stable Diffusionを利用 https://t.co/3hfMeh0odu 劣化画像を高品質な画像に復元するStable Diffusionを用いた修復技術「DiffBIR」。既存技術より高い性能を発揮。 pic.twitter.com/0yBqAKN3qp
— Seamless (@shiropen2) September 27, 2023
・PFNが開発した大規模言語モデル(LLM) PLaMo™︎ー13Bをオープンソースで公開
【発表】PFNが開発した大規模言語モデル(LLM) PLaMo™︎ー13Bをオープンソースで公開しました。また、PLaMoの知見をもとにマルチモーダル基盤モデルを開発・提供する新子会社Preferred Elementsを11月に設立します。10月の #CEATEC2023 ではLLMを使ったデモも出展します。 https://t.co/QfpPh2UuvO
— PFN Tech (@preferred_jp) September 28, 2023
・シードで1億1,300万ドルの資金調達をしたMistralAIがApache 2.0で7Bモデルをリリース
シードで1億1,300万ドルの資金調達をしたMistralAIがApache 2.0で7Bモデルをリリース
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 28, 2023
- 現在利用可能な13Bまでのオープンモデルを、すべての標準的な英語とコードのベンチマークで凌駕
モデル: https://t.co/MeBmgULzVV
github: https://t.co/LlWAHMhE6X
記事: https://t.co/GzNzleph3i https://t.co/S6g0UMwgLN pic.twitter.com/WiGfhHZhoZ
・医療用大規模AI (LVM-Med)
凄い!!!
— 河野 健一 生成AI ✕ 医療に注目! 手術支援AI CEO 脳外科医 (@CeoImed) September 27, 2023
広範囲かつ色々なモダリティに対応
「医療用大規模AI (LVM-Med)」
・ 55 の公的に利用可能なデータセットから約 130 万枚の医療画像を収集
・ CT、MRI、X 線、超音波などの多数の臓器やモダリティをカバー
・ 複数の既存モデルの精度を上回る
・ GitHub で公開 https://t.co/1XjXwyEfkd pic.twitter.com/KvlfnWzrkw
・PLaMo-13B を Colab 無料版で
弊社 PFN が今日公開した PLaMo-13B を Colab 無料版で動かしてみました。何の工夫もしないと A100 80GB クラスの GPU が必要ですが、 4 bit 量子化すると T4 15GB でも推論できます。https://t.co/czCPGAQX1j
— dhgrs (@__dhgrs__) September 28, 2023
・Deep Geometrized Cartoon Line Inbetweening
Deep Geometrized Cartoon Line Inbetweening
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 29, 2023
- 2つの白黒線画の間に中間フレームの生成
github: https://t.co/CreGbQUqU2
論文: https://t.co/xm0LXL2aTW https://t.co/gunUEZxHFi pic.twitter.com/ctoSwCWh9a
・GSGEN: Gaussian Splattingを用いたテキストから3D変換
GSGEN: Gaussian Splattingを用いたテキストから3D変換
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 29, 2023
論文: https://t.co/gjxpZBWxmZ
github: https://t.co/YkYqoqDIVm https://t.co/p8CA7BfttV
・基盤モデルの効果的なロングコンテキスト・スケーリング
基盤モデルの効果的なロングコンテキスト・スケーリング
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 29, 2023
- 最大32,768トークンのコンテキストウィンドウをサポートするロングコンテキストLLMシリーズを発表
- Llama 2 Long(70B)は、ロングコンテキストの一連のタスクにおいて、gpt-3.5-turbo-16kの性能を上回る
論文: https://t.co/ccqNCExCaO https://t.co/dLIBgo8TF0
・MetaによるAnyMAL
MetaによるAnyMAL
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) September 29, 2023
- 効率的でスケーラブルなあらゆるモダリティ拡張言語モデル
- 多様な入力(テキスト、画像、ビデオ、オーディオ、IMUモーションセンサ)を推論
- テキスト応答を生成
論文: https://t.co/OIAmkK9QWf https://t.co/hDyOCYL3Cb pic.twitter.com/Xct7sPYhus