
【6/17-6/23】生成AI活用事例/研究開発-Weeklyまとめ
今週のAIに関する活用事例や研究開発の備忘録記事です。
活用事例
・「LINEのAIチャットくん、200万人の登録者数と6000万通の総メッセージ数を突破!」
AIチャットくんがなんと200万ユーザーを突破しました!!すごい!!これからもプロダクトの価値を高めるようなアプデを積み重ねていきます!/ LINEでChatGPTを使える「AIチャットくん」登録者数200万人、総メッセージ数6000万通を突破! https://t.co/foP7mB0Trg @PRTIMES_JPより
— 山口翔誠 / AIイラストくん・AIチャットくん (@shosemaru) June 22, 2023
・AGC社、社内向けチャットツール「ChatAGC」を導入決定、マイクロソフトの「Azure OpenAI Service」を活用
「ChatAGC」がガラス最大手AGC社で導入決定
-マイクロソフト「Azure OpenAI Service」を活用した社内向けサービス
https://ledge.ai/articles/agc_chatagc… via @Ledge.ai
・DropboxがAIツールDashを開始し、ユニバーサル検索エンジンを提供
DropboxがAIツールDashを開始
あらゆる場所であらゆるファイルを一度に検索することが可能
Dropbox内のファイルだけでなく接続されているアプリのすべてにアクセスできるユニバーサル検索エンジン
・生成AIによるコスト改善は4つの業務に集中し、業種によって異なる。
生成AIによるコスト改善インパクトの75%は 4つの業務に集中。①営業・マーケ、②ソフトウェア開発、③顧客対応、④研究開発の4領域はコスト削減額・幅が大きい。また、生成AIによるコスト改善インパクトは業種によって異なる。ここから分解したユースケースは洪水のように出てくるので別途整理します pic.twitter.com/QdobRinIg3
— 大植択真@エクサウィザーズ /『Web3時代のAI戦略』 (@exa_ouetakuma) June 20, 2023
・AIスタートアップやテック企業で使用される新しいシステム、ツール、設計パターンの例
AI スタートアップやテック企業で使用されているシステム、ツール、設計パターン例
https://a16z.com/2023/06/20/emerging-architectures-for-llm-applications/… #tech @a16zから
・「ソフトバンクG、社内でAIコンテストを実施 優勝賞金1000万円」
"ソフトバンクG社内で生成AIを活用するコンテストを実施したことを明らかにした。提案は10日間で5万2000件あり、優勝賞金は1000万円だという。今後毎月実施する。"
— 金子 剛士 / East Ventures (@evkaneko) June 21, 2023
ソフトバンクG孫社長、いよいよ反転攻勢へ-手元に5兆円超 - Bloomberg https://t.co/IHTN0XhLk9
・EC事業者向けAI商品写真生成SaaS「フォトグラファーAI」を提供するエンジニア集団
EC事業者向けAI商品写真生成SaaS「フォトグラファーAI」の提供をしている鈴木さんはプログラム期間中にアイデアからリリースまで一気に駆け抜けたエンジニア集団です!
— 大久保🛒コマース特化型VC共同代表 (@Koheei_Okubo) June 21, 2023
ぜひ、フォトグラファーAI、使ってみてください!
▼サービスサイトhttps://t.co/PCYKC6MAu5 https://t.co/sR5VlIr3A6 pic.twitter.com/03VI6jLl7c
・SnapchatのAIチャットボットがターゲット広告に活用可能に
SnapchatのAIチャットボットは後にターゲット広告に活用できるとCEOのEvan Spiegelさんが語る。
— Tetsuro Miyatake (@tmiyatake1) June 21, 2023
既に1.5億人がSnapchatのMy AIチャットボットを利用、特定のブランドやトピックについての会話が行われている。https://t.co/ntfbvoMKkM
・MetaがAI投資する領域を発表 - AIアシスタント、AIステッカー、AIメディア編集に注力
Metaが今後のAI投資する領域について説明。
— Tetsuro Miyatake (@tmiyatake1) June 21, 2023
・AIアシスタント:複数のAIを人は使うと仮説している
・AIステッカー:パーソナライズされたステッカーを作れる
・AIメディア編集:画像だけではなく、動画生成技術に投資https://t.co/fhaSMEsgUz
・Epic Games、MetaHuman Animatorを発売 - 高品質な人間の顔を数分でアニメーション化可能
-Epic Games、iPhoneで高品質な人間の顔を撮影する「MetaHuman Animator」を発売
-iPhoneとPCだけで、アニメーションまで数分で完了
https://unrealengine.com/ja/blog/delivering-high-quality-facial-animation-in-minutes-metahuman-animator-is-now-available…
MetaHuman Animator is here to help you unlock the storytelling power of high-fidelity facial animation.
— Unreal Engine (@UnrealEngine) June 15, 2023
From performance to animation in minutes, with just an iPhone and a PC!
It's available now! Learn more: https://t.co/qRyiQj7FkQ pic.twitter.com/q5roMJ7974
・「Azure OpenAI Service」に新機能「On Your Data」が追加され、チャットAIがローカルやAzure上のストレージに保管されたファイルを参照可能に
「GPT-3.5」などのAPIをクラウドサービス「Microsoft Azure」上で使える「Azure OpenAI Service」に、新機能「On Your Data」を追加
ローカルやAzure上のストレージに保管するテキストファイルやPDF、PowerPointファイルを、GUIの操作でチャットAIに参照させられる
https://itmedia.co.jp/news/articles/2306/20/news196.html…
「社内のアレ分からん、教えてAI」実現 Microsoftの“自社版ChatGPT作成サービス”にデータ取り込み機能https://t.co/pdDSNueNcl
— ITmedia NEWS (@itmedia_news) June 20, 2023
・Microsoftが自社版ChatGPT作成サービスにデータ取り込み機能を追加
「社内のアレ分からん、教えてAI」実現 Microsoftの“自社版ChatGPT作成サービス”にデータ取り込み機能https://t.co/pdDSNueNcl
— ITmedia NEWS (@itmedia_news) June 20, 2023
・OpenAI、AIモデルのマーケットプレイスを検討
OpenAIがAIモデルを販売できるマーケットプレイスをローンチすることを検討している。
— Tetsuro Miyatake (@tmiyatake1) June 20, 2023
AIモデルのアプリストアを出すのはOpenAIからするとよりプラットフォーム化に向けての動きと思われるのと、OpenAIのパートナーであるSalesforceやMicrosoftと競合することになる。https://t.co/fRIbKuYTtZ
・Character Creatorのプラグイン最新アップデートで、写真や3Dモデルから高品質な頭部3Dモデルを構築可能に
Headshot 2 - AIの力で写真や3Dモデルから高品質な頭部3Dモデルを構築可能!Character Creatorのプラグイン最新アップデートがリリース!https://t.co/t3QuT2P0oa#3dnchu #Reallusion #CC4 #CharacterCrreator #Headshot pic.twitter.com/PQEHM3DXK3
— 3D人-3dnchu- CG情報ブログ (@ymt3d) June 20, 2023
・英ガーディアン誌、企業にAI利用方針の明確化を促す
英ガーディアン誌が生成AIの利用を表明。企業にとって社員にただ使わせてる時期は終わり、AIの利用方針やリスク対応を固めて、社会やユーザーに説明すべきフェーズに入って来た。https://t.co/CSM6IJGOUO
— 久保田 雅也@ベンチャーキャピタル (@kubotamas) June 19, 2023
・生成AIを使用して合成データセットを構築することができるParallel DomainのAPI
ちなみに、Parallel Domainは合計約4400万ドル調達済み
https://tcrn.ch/3PiVGw0 via @techcrunch
生成AIを使用して合成データセットを構築することができるParallel DomainのAPI
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 20, 2023
ちなみに、Parallel Domainは合計約4400万ドル調達済みhttps://t.co/dHDY8Tr9Qq via @techcrunch
・Gatebox技術を活用した24時間接客可能なAIキャラクター派遣サービスが登場
【AI、バイト始めます】
— 武地 実 @Gatebox コンテンツ東京出展 (@takechi0209) June 20, 2023
接客用AIキャラクター派遣サービス「AIバイト」を法人向けに提供します!
Gateboxの技術で、ChatGPT連携のAIキャラクターが店頭で接客するサービスを作りました。
24時間365日働けます!https://t.co/pQ20jCf3gN
・Vimeo、AIを活用した編集機能を導入
Vimeo、AIを活用した編集機能3種を導入
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 20, 2023
-ユーザーが台本を作成し、映像を録画し、録画から長い間や「ahs」や「ums」のような不要部分を削除するのを助けるように設計されたAI搭載のツール群を発表
-月額20ドル(年間課金)のVimeoのスタンダードプランの一部https://t.co/dqIVW8yqVb via @techcrunch
・Adobe、生成AI『Firefly』をPhotoshopなどに追加し、『Adobe Express』に注力
大手テクノロジー企業のAdobeが、生成AIに関する取り組みを本格化しています。
— Strainer(ストレイナー) (@strainerjp) June 19, 2023
今年3月には生成AI『Firefly』を発表。現時点ではベータ版ですが、早速Photoshopなどの各製品にFireflyの機能を追加しています。
中でも力を入れるのが『Adobe Express』。… pic.twitter.com/XW9vzUPXEb
・AIを活用した網膜スキャンで主要心血管イベントを精度高く予測可能に
Google CEOのSundar PichaiがAIを活用して網膜スキャンで主要心血管イベントをかなり精度高く予測できるのが分かった。
— Tetsuro Miyatake (@tmiyatake1) June 19, 2023
これにウヨってCTスキャンやMRIなどを使わずに患者の状況を理解できる可能性が出てくる。 pic.twitter.com/sQB3CwjC74
・IBMとAdobeがAI技術を活用したコンテンツサプライチェーンソリューションを開始
まさかのタッグ。
— 深津 貴之 / THE GUILD / note.com (@fladdict) June 19, 2023
IBMとAdobeが協力、AI技術を活用したコンテンツサプライチェーンソリューションを開始
* Sensei GenAIサービスとAdobe Firefly等を活用。
* Adobeのエンプラ顧客が、IBM Consultingパーティーションを利用。https://t.co/Pq2dV8UBVT
・「AIエージェント」について解説する記事
私がここ数ヶ月夢中になっている「AIエージェント」について解説する記事を書きました!
— Dory | AI Agent (@dory111111) June 19, 2023
AIエージェントは超超超面白いので、作る人が一人でも増えたら嬉しいです🙌https://t.co/tAYVWJjd53
・AIが作った女性の動画が話題に
この動画の女性、実は完全に0からAIで作られている。
— usutaku@AI情報解説 (@usutaku_com) June 17, 2023
提供しているのは、最近時価総額1000億円を超えユニコーンとなったAI企業のSynthesia。
これはもう全く見分けがつかない…
pic.twitter.com/UICRXg2OD9
・LLM基盤モデル開発事業の強みはデータセットとマーケットリーダーになれるチームの構築
LLMの基盤モデル開発を事業とする場合
— 松本 勇気 | LayerXはSaaS+Fintechの会社です (@y_matsuwitter) June 17, 2023
・独自の大規模で整理されたデータセットがある。
・現状の最先端の実装だけでなく、今後の新たな手法を生み出せる、マーケットリーダーになれる蓋然性高いチームを構築できている。…
・メルセデス、米国でチャットGPT試験を実施
独メルセデス、米国でチャットGPT試験搭載 https://t.co/VJuNpJrTme
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 17, 2023
・京都の左官業界でStable Diffusionを取り入れた株式会社スタッコプラス
京都に本社を構える株式会社スタッコプラス様(https://t.co/kk01edIf9x)は左官業という伝統的な業界でいち早くStable Diffusionを取り入れていらっしゃいます。AIの中だけと思っていた理想のお部屋が現実化されるなんて夢みたいですよね。#StableDiffusion #生成AI pic.twitter.com/Prb2ZXQLSM
— Stability AI 日本公式 (@StabilityAI_JP) June 16, 2023
・韓国のバーチャルアイドルの多様性
韓国のバーチャルアイドルは、色々な形が模索されてる
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 17, 2023
-全員AIのMAVE
-リアルメンバーとメタユニバース内のAIアバター(ae)で構成されたメタユニバースガールズグループのaespa
-キャラ生成AIによるグループETERN
-バーチャルリアル統合ボーイグループのスーパーカインドhttps://t.co/QjtGNmKu4K https://t.co/PTwVZpSXjX
・ChatGPTを旅ガイドにしたAVA Travelのチームワーク
ChatGPTを「旅ガイド」にしたAVA Travelーーカムスタ!チームワークのお話https://t.co/hu9fxNciIs
— BRIDGE(JP) (@thebridge_jp) June 23, 2023
・AIとデジタルヒューマンが手掛けるライブコマース店舗「Lumiwink」が16万人の注目を集める
【こぼれ話】先日の618セールでデザイン、ネーミング、装飾、商品デザイン、マーケティングをAIが行い、デジタルヒューマン「馬斯氪」がライブコマースで販売する店舗が登場しました。36Kr(中国)による店舗「Lumiwink」で2時間で16万人が視聴。多くの人の関心を集めましたhttps://t.co/DEmzQcVosX pic.twitter.com/HyCtKkKZBL
— 36Kr Japan@中国テック・スタートアップ専門メディア (@36krJ) June 23, 2023
・アクセンチュアがプライベートGPTを構築し、自社業務や顧客への導入支援を開始
“アクセンチュアではすでにプライベートGPTともいえるジェネレーティブAIの環境を構築し、自社での業務への提供や顧客への導入支援を開始している”とのこと。
— コンサルマン (@mr_grayhair) June 23, 2023
アクセンチュアが推進する「EnterpriseGPT」とは?プライベート型ジェネレーティブAIの構築と運用の勘所https://t.co/8NrNXNTa2C pic.twitter.com/zMeFbsYlLl
・みずほと富士通、AIを活用したシステム開発の実証実験を開始
みずほ、システム開発保守に生成AIを活用。富士通と実証実験を開始
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 23, 2023
>設計書の記載ミスや漏れを自動で検出し、システム開発の品質を向上させることを目的とし、ソースコードの生成をAIが代替できるかを検証する予定。実験は2024年3月31日まで行われるhttps://t.co/AC2FXzkotI via @Ledge.ai
・「a16z調査:243のゲームスタジオの87%がAIを使用中、ChatGPTが最も人気」
大手VCのa16zのAIとゲームスタジオについての調査。243の大小スタジオに利用を聞いたところ87%が“現在”使用中。ChatGPT 89%、Midjourney 71%、StableDiffusion 52%が使用される生成AIトップ3。 https://t.co/x4GSkpCsl6
— 新清士@(生成AI)インディゲーム開発者 (@kiyoshi_shin) June 22, 2023
・AmazonのAWS、AI関連企業に$100Mの資金提供プログラムを発表
AmazonのAWSがAI生成技術や関連する会社に$100Mほど資金提供するプログラムを立ち上げたことを発表。https://t.co/xy2rcNZD8X
— Tetsuro Miyatake (@tmiyatake1) June 23, 2023
・それはコンピューターではない、コンパニオンなのだ by a16z
それはコンピューターではない、コンパニオンなのだ by a16z
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 23, 2023
インフルエンサーのCarynが作成したチャットボットCarynAIを始め、単なる1対1の会話を超え、友人や家族との関係に溶け込んでいるAIコンパニオンの周辺情報に関して
(続きはスレッド)https://t.co/eYu3eYhbTa
・YouTubeがAIによる吹き替えを導入
YouTubeがAIによる吹き替えを導入
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 23, 2023
また、吹き替え音声をクリエイターの声のように近づけたり、唇の動きも吹き替えに合わせる機能を2024年に計画https://t.co/xL3AYoBce0
・Figmaの新機能「Genius」がチャットインターフェースでUIを段階的に生成可能に
Figmaに搭載される、テキスからUI 生成するGeniusのデモ動画を見るに...
— しょーてぃー / Experience & Prompt Designer (@shoty_k2) June 22, 2023
競合サービスと違い、チャットインターフェースで段階的にパーツレベルで生成することができるのがとても良い。pic.twitter.com/Ch4MxmWdEC https://t.co/y4dSoq1OEC
・GoogleのDuet AIがスプレッドシートでカスタムテンプレートを作成可能に
GoogleのDuet AIはスプレッドシートでも使えるようになり始めた。
— Tetsuro Miyatake (@tmiyatake1) June 23, 2023
どんなシートを作りたいのかをテキストで入力するとカスタムテンプレをAIが作ってくれる。https://t.co/lapGu6Xfgm pic.twitter.com/dNoPPzms2w
・AGC社、社内向けチャットボット「ChatAGC」を導入決定、マイクロソフトのAIサービスを活用
「ChatAGC」がガラス最大手AGC社で導入決定
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 22, 2023
-マイクロソフト「Azure OpenAI Service」を活用した社内向けサービス
https://t.co/T0Q380wNRx via @Ledge.ai
研究開発
・LangChainが新機能を追加、OpenAI Multi Functions Agentを導入
LangChainまたまた新機能: OpenAI Multi Functions Agent|はまち @hama_jp #note #AIとやってみた https://t.co/1Fj2wKxU7z
— はまち (@hama_jp) June 21, 2023
・CrestaがAIを活用した世界初のコンタクトセンター基盤モデル「Ocean-1」を発表
Ocean-1 : 世界初のコンタクト センター基盤モデル
-合計1億5100万ドル調達し、AIで顧客サービスの品質向上を支援するCrestaから
-これまで蓄積したコンタクト センターのドメイン データやフィードバックを利用し作成
https://cresta.com/blog/introducing-ocean-1-worlds-first-contact-center-foundation-model/…
Today, We introduced Ocean-1, a foundation model for the contact center.
— Tim Shi (@timshi_ai) June 21, 2023
It's the culmination of our experience in generative AI for large enterprises and our latest milestone in advancing the cutting edge for customer facing conversations.https://t.co/2jmYmyG2oN pic.twitter.com/8Z3D7zaQN7
・M1/M2 MacでローカルLLMが2倍速く
LLaMAの全モデルをサポート
デモは、16GBのRAMを搭載したM2 Macbook Pro上で動作する13BパラメータのLLM
http://gpt4all.io
M1/M2 MacでローカルLLMが2倍速く
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 21, 2023
- LLaMAの全モデルをサポート
- デモは、16GBのRAMを搭載したM2 Macbook Pro上で動作する13BパラメータのLLMhttps://t.co/2MXJitj6tu https://t.co/fhCbRtFTNE pic.twitter.com/oKbFKgNnF9
・FastSAMが50倍高速化し、SAM手法と同等の性能を達成
おーーー
SAMの高速化版!FastSAM!
50倍の実行速度でSAM手法と同等の性能を達成
モデルは変わらずApache 2.0 license
huggingface: https://huggingface.co/papers/2306.12156…
github: https://github.com/CASIA-IVA-Lab/FastSAM…
Fast Segment Anything
— AK (@_akhaliq) June 22, 2023
paper page: https://t.co/zvrNniWr5C
The recently proposed segment anything model (SAM) has made a significant influence in many computer vision tasks. It is becoming a foundation step for many high-level tasks, like image segmentation, image caption, and… pic.twitter.com/s1csd34Z35
・ LLMライブラリの評価結果
個人的LLM周りのライブラリ等の評価
— 智基/Tomoki@REIMEI CEO (@tomolld) June 21, 2023
「LangChain」
長所:昨日出た論文の機能が今日できてるみたいな速度感。
短所:抽象度が高く、コードの深い部分の変更を行おうとするとソースが汚くなりがち。バグが多い。
「guidance」
長所:LLM出力の構造化。…
・「Multi-modal LLM」は大規模事前学習モデルのマルチモーダル化に焦点を当てたメタサーベイ
VandL / VideoRecog Groupによるメタサーベイ「Multi-modal LLM」が公開されました!大規模事前学習モデルのマルチモーダル化を中心に調査されています。 https://t.co/DYa0PcquhI pic.twitter.com/ec3yKkgQRa
— Hirokatsu Kataoka | 片岡裕雄 #CVPR2023 (@HirokatuKataoka) June 21, 2023
・「MAGVIT:10種類の動画生成タスクに対応するトランスフォーマー」MAGVIT: イメージアニメーション、動画編集、アウトペイントを含む10種類の動画生成タスクに対応するトランスフォーマー
github(まもなく): https://github.com/MAGVIT/magvit
詳細: https://magvit.cs.cmu.edu
Introducing MAGVIT, a single transformer designed to address ten video generation tasks, including future image animation, video editing and video outpainting. Stop by the #CVPR2023 Google booth at 10am today to see it in action! More details at: https://t.co/nd7Gew2ozv pic.twitter.com/8J35j5fnIG
— Google AI (@GoogleAI) June 21, 2023
・ FLAN命令データセットを使用したOpenLLaMAモデル、Flan-Open-Llama-7bがリリースされる。商用利用にはPROスペースまたは推論エンドポイントが必要。
FLAN命令データセットでチューニングされたOpenLLaMAモデル、Flan-Open-Llama-7bをリリース
下から使えるが、モデルが大きいので、商用利用の場合は、PRO スペース、または推論エンドポイントが必要
https://huggingface.co/conceptofmind/Flan-Open-Llama-7b…
Releasing Flan-Open-Llama-7b, an OpenLLaMA model fine-tuned on the FLAN instruction dataset. https://t.co/CLb3yiwOMH
— Enrico Shippole (@EnricoShippole) June 21, 2023
・Facebookが公開した多言語音声認識のコードとモデル
Metaの大規模多言語音声(MMS)プロジェクトのコードとモデル
プロジェクト: https://ai.facebook.com/blog/multilingual-model-speech-recognition/…
github: https://github.com/facebookresearch/fairseq/tree/main/examples/mms…
model: https://huggingface.co/models?other=mms…
※ただ、コードとモデルはCC-BY-NC 4.0ライセンス
Meta AI released Scaling Speech Technology to 1,000+ Languages
— AK (@_akhaliq) June 21, 2023
demo: https://t.co/1yMek3Uzbl
Expanding the language coverage of speech technology has the potential to improve access to information for many more people. However, current speech technology is restricted to about… pic.twitter.com/BHmA7J5YnW
・Metaが新たに開発した音声認識AI「MMS」は1,406言語に対応、デモも公開中
Metaの新開発した音声認識AI「Massively Multilingual Speech(MMS)」
— 刈宮 宥 (@Callimiya) June 21, 2023
1,406言語の事前学習済みwav2vec 2.0モデル、1,107言語に対する自動音声認識、音声合成モデル
更に言語識別なら4017言語にも及ぶと
デモもありもう実際に使える https://t.co/itDfKgxjmF
・DB-GPT: プライバシー保護されたデータベースインタラクションの革新DB-GPT: プライベートLLMによるデータベースインタラクションの革新
-ローカライズされたGPT largeモデルを使用して、データと環境と対話する実験的なOSSプロジェクト
-データ漏洩のリスクはなく、データは安全であることを保証可能とのことGithub: https://github.com/csunny/DB-GPT
DB-GPT: Revolutionizing Database Interactions with Private LLM Technology
— AK (@_akhaliq) June 21, 2023
github: https://t.co/4uLnpUGxAM
As large models are released and iterated upon, they are becoming increasingly intelligent. However, in the process of using large models, we face significant challenges in… pic.twitter.com/4UdYsVomV3
・画像の全領域を一度にセグメンテーションする対話型モデルSEEMの提案Segment Everything Everywhere All at Once
-画像内のあらゆる場所を一度にセグメンテーションするためのプロンプト可能な対話型モデルであるSEEMを提案
論文: https://arxiv.org/abs/2304.06718
デモ: https://36771ee9c49a4631.gradio.app
(なぜかデモアクセスできない)
Segment Everything Everywhere All at Once
— AK (@_akhaliq) April 14, 2023
abs: https://t.co/npJ6Kf25aa @Gradio demo: https://t.co/mRrrfvwBX7 pic.twitter.com/ipH1GKLsAl
・Automation AnywhereがAWSと提携し、企業内業務の自動化を促進
RPA大手Automation AnywhereがAWSと提携、生成AIで企業内業務の自動化促進
GCPやAWSと連携し、Automation Co-Pilot + Generative AI、オートメーター向けのAutomation Co-Pilot + Generative AI、ドキュメントオートメーション + Generative AI などを発表する予定
・ LLMによるフィルタリングと生成で高性能を達成
LLMの学習ではデータの質が重要であり、明確、自己完結、有益でバランスされている「教科書」のようなデータと微調整用「練習問題」を既存LLMによるフィルタリングと生成で用意。結果のphi-1は1/10のモデルサイズ、1/100のデータ量でコード向け既存OSS LLMを超える性能を達成 https://t.co/Gg3Gc3bwKv
— Daisuke Okanohara / 岡野原 大輔 (@hillbig) June 21, 2023
・ロボティクス基盤モデルにおけるLLM/LVMの調査と応用
「大規模言語・視覚モデルを用いたロボティクス基盤モデル」を公開しました!大規模言語モデル(LLM)/大規模視覚モデル(LVM)に関する調査、そのロボティクス応用について調査・メタ分析しています。ChatGPT (含:GPT-4) も一部説明あります。 https://t.co/kCIHIUpJMs pic.twitter.com/Cn3AhNGJgA
— Hirokatsu Kataoka | 片岡裕雄 #CVPR2023 (@HirokatuKataoka) June 21, 2023
・「visionOSのSDKがXcode 15 beta 2に追加されました」
visionOSのSDKがご利用いただけるようになりました!Xcode 15 beta 2に、Reality Composer ProもvisionOSシミュレーターも含まれておりますので、是非お試しください!!ドキュメントやサンプルコードもご利用いただけます!https://t.co/k7By6yvmmj
— Masashi Toyota (@toyochang) June 22, 2023
・OpenAIのFunction callingを使った小説解析
Function callingに興奮したので思わずnoteにまとめました。
— 松xR (@matsu_vr) June 20, 2023
OpenAIのFunction callingで小説の解析をしてみる|松xRのnote #note https://t.co/eN3sH886zb
・「LLMアプリケーションの新しいアーキテクチャとツールについての見解」
Seemingly everyone wants to build LLM-based apps. But finding the right architecture and tooling can be difficult.
— a16z (@a16z) June 20, 2023
Here’s what @BornsteinMatt and @rajko_rad are seeing, including their current view of the LLM app stack 👇 https://t.co/EIXBqlaZjp pic.twitter.com/mpgpfYI4jj
・「CVPR2023のworkshopで、拡散モデルを使った高品質&精緻な画像編集の高速&省コスト実現方法を発表」
CVPR2023のworkshopにて、共著論文の発表(oralで採択)があります。https://t.co/RCGzlxSNyj
— mi141 (@mi141) June 13, 2023
拡散モデルを使った高品質&精緻な画像編集を、高速&省コストに実現する方法を提案しています。ご興味のある方はぜひ!(ちなみに筆頭は昨年度の新人で、初年度に取り組んだ研究をまとめたものです) https://t.co/xKixRIh8mh pic.twitter.com/F4vKgjcbHg
・CVPRでアニメキャラの3D復元が実現
今年のCVPRにアニメキャラの三次元復元があったらしい。へー、通るもんなんだ。こういうのACMMMが巻き取ると思っていたのだが。https://t.co/0Dxi6uU8wJ pic.twitter.com/i5vYHYoHJP
— あるふ (@alfredplpl) June 21, 2023
・GPTモデルの信頼性に脆弱性があることが判明
DecodingTrust: GPTモデルにおける信頼性の包括的な評価
-信頼性の脅威に対するこれまで知られていなかった脆弱性を発見
DecodingTrust: A Comprehensive Assessment of Trustworthiness in GPT Models
— AK (@_akhaliq) June 21, 2023
paper page: https://t.co/k1dBVKFjTd
Generative Pre-trained Transformer (GPT) models have exhibited exciting progress in capabilities, capturing the interest of practitioners and the public alike. Yet,… pic.twitter.com/HfONAQgyT8
・Meta AIがCVPR2023で発表した論文に注目
#CVPR2023 — Here are 6️⃣ Interesting new papers you should know about from Meta AI — and how you can access them if you’re not at the conference.
— Meta AI (@MetaAI) June 20, 2023
🧵
・「生成AIが作った文章」を学習させ続けると破綻する可能性がある
生成AIに“生成AIが作った文章”を学習させ続けるとどうなる? 「役立たずになる」と英国チームが報告 https://t.co/RupPA6cEfu ネット上に言語生成AIが作成した似たような文章が氾濫し,それらを学習する新言語生成AIがデータの多様性が確保されない学習となり破綻する。回避には人が書いた文章が必要。 pic.twitter.com/pfRRyE5jvb
— Seamless (@shiropen2) June 21, 2023
・GPT-4は1.76兆パラメータの混合モデルであることがリークされる
GPT-4に関する特大のリーク情報
— 今井翔太 / Shota Imai@えるエル (@ImAI_Eruel) June 21, 2023
MetaのPyTorchの開発リーダーも認めている&似た話が一部で共有されていた,ということで結構確度は高いです
曰く,
"GPT-4は220Bパラメータのモデル8つ(2200億x8 = 1.76兆パラメータ)からなる混合モデルで,各モデルは別のデータ/タスクで学習している"
とのこと… https://t.co/tCgNDJ3nPM
・Inflection.Aiの創設者が新しいチャットボットのテストを提案
パーソナルAIアシスタントを開発するhttp://Inflection.Aiの創設者スレイマンがチャットボットの新しいチューリングテストを提案
・Baichuan Intelligent Technologyが開発したオープンソースLLMが高性能を発揮
baichuan-7B
-Baichuan Intelligent Technologyが開発したオープンソースLLM
-Transformerアーキテクチャに基づき、約1.2兆個のトークンで学習
-中国語と英語の両方をサポート
-コンテキストウィンドウは4096
baichuan-7B
— AK (@_akhaliq) June 20, 2023
model on @huggingface: https://t.co/pueNVAgZ9u
baichuan-7B is an open-source large-scale pre-trained model developed by Baichuan Intelligent Technology. Based on the Transformer architecture, it is a model with 7 billion parameters trained on approximately 1.2… pic.twitter.com/1Ce5VNrG1Q
・Infinigen - 自然界のフォトリアルな3Dシーンをプロシージャル生成するオープンソースツール
自然界のフォトリアルな3Dシーンをプロシージャル生成するInfinigen
-フリーでオープンソース(BSD 3-Clause License)
-形状からテクスチャまで、すべてのアセットがランダムな数学的ルールによってゼロから生成
Infinite Photorealistic Worlds using Procedural Generation
— AK (@_akhaliq) June 20, 2023
paper page: https://t.co/HiSl313uEN
introduce Infinigen, a procedural generator of photorealistic 3D scenes of the natural world. Infinigen is entirely procedural: every asset, from shape to texture, is generated from… pic.twitter.com/K1iGHwRaht
・vLLM - 高速なオープンソースのLLM推論および処理ライブラリ
-オープンソースのLLM推論および処理ライブラリ
-HuggingFace Transformers を 24 倍高速化し、Vicuna と Chatbot Arena をパワーアップ
-中核のPagedAttentionは、モデル変更なく、5倍以上のシーケンスを一緒にバッチ処理可能
Github: https://github.com/vllm-project/vllm…
ブログ: https://vllm.ai
vLLM
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 21, 2023
-オープンソースのLLM推論および処理ライブラリ
-HuggingFace Transformers を 24 倍高速化し、Vicuna と Chatbot Arena をパワーアップ
-中核のPagedAttentionは、モデル変更なく、5倍以上のシーケンスを一緒にバッチ処理可能
Github: https://t.co/pVHGN4DCGQ
ブログ: https://t.co/XMAamIvqqz https://t.co/JGq3jBpZlb pic.twitter.com/STPpqi34zQ
・Google DeepMindがロボット操作のための自己改良型基盤エージェント「RoboCat」を発表
Google DeepMindがロボット操作のための自己改良型基盤エージェント「RoboCat」を発表。
— bioshok(INFJ) (@bioshok3) June 20, 2023
100~1000の人間によるデモでRoboCatを微調整することで多様なロボットアームタスクを習得可能。
新しいロボットアームでのタスクにも汎化できる。
事前訓練時にはデモデータを用いて報酬関数を訓練し、 https://t.co/iL36elNhSR pic.twitter.com/IHyL59r6ls
・「CVPR」で論文投稿数・採択数は過去最高を記録。最多出現ワードは「Diffusion model(拡散モデル)」
https://research-p.com/column/1237
近年、画像や動画や3Dなどの生成AIで革命的な発展を遂げてるコンピュータビジョン分野。そのトップ国際会議
— 小猫遊りょう(たかにゃし・りょう) (@jaguring1) June 20, 2023
「CVPR」で論文投稿数・採択数は過去最高を記録。最多出現ワードは「Diffusion model(拡散モデル)」https://t.co/HJ3QrRMnSb
「CVPR2023では9,155件の論文が投稿され、2,357件の論文が採択」 pic.twitter.com/0oxhYGEwKp
・RWKVにWIKIページが新設
https://wiki.rwkv.com
RWKVのWIKIページができていた。https://t.co/pyREYGQLRT
— masaoutiyama (@masaoutiyama) June 20, 2023
・チャット履歴を利用して、その質問が前の対話の続きなのか、それともまったく新しい質問なのかを判断
新しい文脈対応
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 20, 2023
チャット履歴を利用して、その質問が前の対話の続きなのか、それともまったく新しい質問なのかを判断@zahidali133 https://t.co/js4zxcNHLX pic.twitter.com/R7LeeF8bM0
・OWLv2を使った物体検出において40%の性能向上を実現
Check out OWLv2; leveraging large scale pre-training---which has been hugely potent for classification, captioning, & LMs---for object detection.
— Neil Houlsby (@neilhoulsby) June 19, 2023
>40% (relative) performance improvement in the open-vocab setting. https://t.co/WNDPhSOMYC
・ChatGPTに匹敵する商用版を今年中にリリース予定、将来的に日本語ベースのStable Diffusionを計画
>ChatGPTに匹敵する商用版を今年中にリリースする予定
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 20, 2023
>将来的に日本語ベースのStable Diffusionを作成する計画があるhttps://t.co/RBirFgZpdA
・「逆スケーリング」による性能低下の論文が発表される
GPTに関する話題で,個人的にかなり気になっていた「逆スケーリング」に関する論文が出てました
— 今井翔太 / Shota Imai@えるエル (@ImAI_Eruel) June 20, 2023
Inverse Scaling: When Bigger Isn’t Betterhttps://t.co/8TNNV0Efgk
LLMは普通,スケーリング則でサイズが大きくなると性能も良くなりますが,これらの「逆スケーリング」タスクでは逆に性能が下がります… pic.twitter.com/adwuFjH3Qo
・顔写真から化粧のパターンを抽出する研究がEurographics2023で採択される
■Research Blog公開■#AILab 研究員の楊が1枚の顔写真から化粧のパターンを抽出する研究として、#Eurographics2023 で採択された論文「Makeup Extraction of 3D Representation via Illumination-Aware Image Decomposition」について紹介しています。https://t.co/1AQ814qRi9
— CyberAgent AI事業本部広報 (@cyberagent_ai) June 20, 2023
・MagicBrush: 手順に従った画像編集のための大規模な手動注釈付きデータセット
🪄Introducing #MagicBrush, the first large manually-annotated dataset for instruction-guided image editing🎨
— Kai Zhang (@DrogoKhal4) June 19, 2023
Proj: https://t.co/q9IdTF1zbK
MagicBrush has >10K editing turns, supporting various editing scenarios: multi-turn, single-turn, mask-provided & mask-free. https://t.co/hoJOX9IjMk pic.twitter.com/rq0tcpwu0i
・SnapchatがAI画像生成モデル「SnapFusion」を開発
SnapchatがAI画像生成モデル「SnapFusion」を開発したことを発表。https://t.co/wUvO7n2ZQyhttps://t.co/dUl9884zO0 pic.twitter.com/EPihGlHVxG
— Tetsuro Miyatake (@tmiyatake1) June 20, 2023
・text-generation-webuiでRinna、OpenCALM、RWKVを試す
text-generation-webui で Rinna・OpenCALM・RWKV を試す|npaka @npaka123 #note https://t.co/Vzqzqo0KBG
— 布留川英一 / Hidekazu Furukawa (@npaka123) June 19, 2023
・WizardLMとWizardCoderは、自動生成された指示により、LLMの微調整を改善
LLMを追加指示で微調整する際の指示は人手で作るのが多いが、網羅性の問題や人で作るのが難しい場合もある。WizardLM (https://t.co/jwJUgYhhiP) は基本指示を変化パターンに基づき指示を自動生成する。それがCodeに特化したWizardCoder (https://t.co/FrEHkcaTdU)は従来手法の性能を大幅に改善する
— Daisuke Okanohara / 岡野原 大輔 (@hillbig) June 19, 2023
・NTTセキュリティが開発したChatGPT、98%以上の精度でフィッシングサイトを自動検出
ChatGPTでフィッシングサイトを自動検出する方法 NTTセキュリティが開発 精度は98%以上https://t.co/wTbE3aHyTd
— ITmedia NEWS (@itmedia_news) June 18, 2023
・Google ColabでPaLMを使用可能に
Google Colabで、PaLMを使うことができるようになりましたので試してみました。自然言語の中で変数を使うことができるのは大きな変化かと思います。 https://t.co/FmMAWr7Jag
— 阿部雅之 (@7QjuW9P8SpP7PUM) June 18, 2023
・OpenLLaMA 13Bモデルがリリース
OpenLLaMA 13B Released
— AK (@_akhaliq) June 18, 2023
model: https://t.co/u5ncJO05E4
present a permissively licensed open source reproduction of Meta AI's LLaMA large language model. We are releasing 3B, 7B and 13B models trained on 1T tokens. We provide PyTorch and JAX weights of pre-trained OpenLLaMA… pic.twitter.com/xTirdxPTnf
・「HQ-SAM」技術で超高精度な背景分離が可能に
虫の細い触角も抜き取れる。画像内の物体を超高精度で背景と分離する技術「HQ-SAM」 https://t.co/xSKtH4KXZG Meta開発のセグメーションモデル「SAM」を改良したハイモデル。蝶の触角やテニスラケットの網目,背景と同化する生き物まで境界を明確にして切り出す。 pic.twitter.com/ETI6XckWr1
— Seamless (@shiropen2) June 19, 2023
・RWKVとsqlite-vssを使った高速なベクトル検索の実装
やっぱりRWKVは早い。これもう少し活用できないかなと思って次元削除などをして挑戦してみました
— Yusuke Hata (@octu0) June 17, 2023
RWKVとsqlite-vssで高速なベクトル検索を作ってみる|Yusuke Hata https://t.co/d2SnR4NYS7 #zenn
・Google Colabを使用してOpenCALM-largeのファインチューニングを試す
Google Colab で OpenCALM-largeのLoRAを使わないファインチューニングを試す|npaka @npaka123 #note https://t.co/PisUpPrGcR
— 布留川英一 / Hidekazu Furukawa (@npaka123) June 18, 2023
・Google ColabでOpenLLaMA-13Bを試す方法
Google Colab で OpenLLaMA-13B を試す|npaka @npaka123 #note https://t.co/8MpQQP9lR6
— 布留川英一 / Hidekazu Furukawa (@npaka123) June 18, 2023
・LLMとナレッジグラフの融合に向けたロードマップ提示
LLMとナレッジグラフ(KG)の融合
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 18, 2023
KG: Wikipediaなど、事実知識を明示的に保存する構造化された知識モデル
LLMとKGの統合に向けたロードマップを提示
1) LLMの事前学習・推論時にKGを組み込み、LLMの理解度向上
2) LLMを様々なKGタスク(埋め込み、補完、構築)に活用
3)… https://t.co/1AJgoSdbrN pic.twitter.com/Km6WEbvRtb
・東北大と理研が報告するAIによる英文校正の研究成果
英文校正promptで一番成績が良かったもの👇👇
— 限界助教|ChatGPTで論文作成と科研費申請 (@genkAIjokyo) June 17, 2023
Reply with a corrected version of the input sentence with all grammatical and spelling errors fixed. If there are no errors, reply with a copy of the original sentence.
東北大と理研からの報告https://t.co/GzLH3D4Dmf pic.twitter.com/BdqekUxwg2
・拡散モデル講演資料が公開
そういえば同僚が昨日講演した内容(拡散モデルの基礎と応用)についても、以下に資料が公開されていますので、気になる方はぜひ!https://t.co/RreX1mp8C6
— mi141 (@mi141) June 16, 2023
・Transformerモデルの包括的なサーベイ
Transformerを使ったモデルについての包括的なサーベイ。
— すえつぐ|自然言語処理(NLP) (@NLP_sue) June 16, 2023
Transformerはテキストはもちろん、画像、マルチモーダルモデルなど、幅広く応用されてる。
ものすごいスピードで発展してるTransformerモデルの全体感整理に使えそう。
時間がある時に読んでおきたい論文。https://t.co/U574VKk0Gu pic.twitter.com/xxdB3Vq3BQ
・「function calling」の使い方と例について
開発知識が必要になりますが最近公開された function calling のイメージと具体的な例がわかるとても良い記事でしたhttps://t.co/nFmaXbkXIv
— 吉田塁 | Lui Yoshida (@luiyoshida) June 17, 2023
・NTTと早大、誤った正規表現の文字列抽出を自動で修正する技術を発表
NTTと早大、誤った正規表現の文字列抽出を自動で修正する技術を発表 - ZDNET Japan https://t.co/UIXPF0KA2Q @zdnet_japanより
— AI 人工知能 ニュース (@ai_news_jp) June 17, 2023
・クラウドソーシングの人間アノテータがGPTなどを使用している可能性
とんでもタイトルの論文が出てたので読んでみると面白かった
— 今井翔太 / Shota Imai@えるエル (@ImAI_Eruel) June 17, 2023
Artificial Artificial Artificial Intelligencehttps://t.co/yfPj2jhZLD
既に4~5割近いクラウドソーシングの人間アノテータがこっそりGPT等のLLMを使っているのではという話…
・gen関数の解説とアップデート情報
https://twitter.com/mah_lab/status/1669985755114897408
・LangChainが新機能「Tagging」を導入
LangChainの 新機能Taggingを試す|はまち @hama_jp #note https://t.co/eg593RpRHF
— はまち (@hama_jp) June 17, 2023
・Livedoorニュースコーパスを簡単に呼び出せるhuggingface datasetsが登場
日本語の NLP で入門的に扱われる Livedoor ニュースコーパスを、実はこっそり huggingface datasets 🤗 にして簡単に呼び出せるようにしていました。いざ書くと微妙に面倒くさい読み込みを、かなり簡単にします!
— しゅんけー (@shunk031) June 17, 2023
🤗 https://t.co/X84G5eJ5xh
🐙 https://t.co/c5HSFSuSf2
📝 https://t.co/Bcvsi4Y1Xg pic.twitter.com/tHmyQqvvvu
・Robin-V2シリーズのモデルがLLMベンチマークで高得点を獲得
🎉Exciting news!🎉 Our finetuned Robin-33B-V2 scored an impressive 64.1 on the @huggingface LLM leaderboard in our offline evaluation! 🔍Check out our Robin-V2 series models, including 7B, 13B, 33B, and 65B versions. Upgrade your language modeling game today! #NLP #LanguageModels https://t.co/oLO3x4bqVS pic.twitter.com/9nnPIZ3BE1
— Shizhe Diao (@shizhediao) June 16, 2023
・Huggingface hubにてRobinモデルのチェックポイントを公開
Hi,
— Shizhe Diao (@shizhediao) June 16, 2023
Thanks for your attention!
We have released all of these checkpoints at huggingface hub. Please try it out:
Robin-65b-v2: https://t.co/XDKKCEjFre
Robin-33b-v2: https://t.co/L7x9icCYBU
Robin-13b-v2: https://t.co/quvLtGtxBO
Robin-7b-v2: https://t.co/mzomoElS6k
・テキストから動画変換可能なゼロショット技術のデモ
ゼロショットで、テキストによる動画変換
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 17, 2023
デモ: https://t.co/4Kaq9Lmipa https://t.co/ZDq9Rzk3DR pic.twitter.com/R68BE9nunP
・Googleが開発したテキストから3Dアバター生成
DreamHuman:テキストからアニメーション可能な3Dアバター生成論文 by Google
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 17, 2023
プロジェクト: https://t.co/K7qrJ7RsOn
論文: https://t.co/rmr1MDX2PL https://t.co/k6Vuc8A95X pic.twitter.com/7skWWNxbTu
・MiniLLMによる大規模言語モデルから小規模言語モデルの抽出
大規模言語モデルの知識蒸留
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 17, 2023
- 大規模言語モデルから小規模言語モデルを抽出するMiniLLMを提案
- 120Mから13Bのパラメータを持つ様々なモデルに対応
github: https://t.co/FQPFdpUElx
論文: https://t.co/9l0dTOKgL7 https://t.co/5PWc9YXhsZ pic.twitter.com/AlHeKoqQwk
・新しい仮想試着モデル「TryOnDiffusion」にParallel-UNetアーキテクチャを提案
新しい仮想試着モデルのTryOnDiffusion
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 16, 2023
2つのUNetを統合した拡散ベースのアーキテクチャParallel-UNetを提案https://t.co/p6tHOXjYZX https://t.co/IerWWTMW5M pic.twitter.com/oDmckXqoRe
・Googleが拡散モデルベースの仮想試着研究を発表
Googleより、拡散モデルベースの仮想試着研究ブログhttps://t.co/buR8NAFPEJ https://t.co/F0c4sR2LEs pic.twitter.com/zYyz5rRQOv
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 16, 2023
・多言語音声合成モデルVoicebox
汎用性の高いテキストガイドの多言語音声合成モデルVoicebox https://t.co/xIznogVuMq
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 16, 2023
・大規模言語モデルは因果関係を推定できない?研究者が40万個の問題で調査
・HuggingFace版Whisperに単語レベルのタイムスタンプが追加
HuggingFace版Whisperに、単語レベルのタイムスタンプを追加https://t.co/V8XUgy41Ai https://t.co/MbV5w1EUrR
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 23, 2023
・Inflection AI、会話APIを通じてInflection-1を利用可能に。広範なベンチマークで上回る
Inflection AIが、https://t.co/zsHntk274Sを支える社内LLMであるInflection-1を会話APIを通じて利用可能に
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 23, 2023
-広範なベンチマークでGPT-3.5、LLaMA、Chinchilla、PaLM-540B を上回るhttps://t.co/yhsdS9iq1h pic.twitter.com/unF8iXbAip
・音声理解と生成にの大規模言語モデルAudioPaLM
音声理解と音声生成のための大規模言語モデルAudioPaLM
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 23, 2023
-テキストベースの言語モデルPaLM-2と、音声ベースの言語モデルAudioLMを統合
-テキストと音声を処理・生成し、音声認識や音声翻訳などのアプリケーションに利用https://t.co/SBb67Oc08G https://t.co/4QStwKzPsr pic.twitter.com/9JogTLclzV
・画像の視覚的特性を保持したレイアウト編集手法
拡散モデルを用いた画像の連続レイアウト編集
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 23, 2023
-画像の視覚的特性を保持しながらレイアウト編集を行う手法を提案
-コードは、また公開予定
論文: https://t.co/TnRjiEQ6aq https://t.co/0liDLJX9mF pic.twitter.com/uDNeO2dR31
・StableAI、SDXL 0.9をリリース
StableAIが、Stable Diffusionの最新バージョンSDXL 0.9をリリースhttps://t.co/D3fwRUkgEA https://t.co/VnKP4j6Zvu pic.twitter.com/KNiTSjBaIP
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 23, 2023
・wanda: LLMの50%枝刈りで精度劣化少ない手法の提案と、4bit近くに量子化することでfp16の1/8サイズに圧縮可能性の検証
LLM の重みを 50% 枝刈りしても精度の劣化の少ない手法 wanda が提案された。
— Kai INUI (@_kaiinui) June 22, 2023
4bit 近くに量子化する手法はいくつかでているので、併せて適用することができれば、理論上 fp16 の 〜1/8 のサイズに圧縮することができる。 https://t.co/CJOOp8EvPp
・StyleSync - リップシンクを高精度に実現するフレームワーク
StyleSync
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 22, 2023
忠実度の高いのリップシンクを可能にするフレームワーク
論文: https://t.co/nZw63ozfkw
プロジェクト: https://t.co/fzhEkprs5a
Github: まもなく https://t.co/dbpp0jqM50 pic.twitter.com/u2JY4hImU9
・MPT-30B: 商用利用可能なオープンソース最新モデル、最大8000コンテキストの1Tトークンで学習
MPT-30B
— 納村 聡仁 / Osamura Akinori (@akinoriosamura) June 22, 2023
-@MosaicMLのオープンソースで商用利用可能な最新モデル
-最大8000コンテキストの1Tトークンで学習
-InstructとChatが大幅に改善https://t.co/p8lMDXVJJ8 https://t.co/7yTwim1saM pic.twitter.com/ZaKBOi9Kwr