【6/17-6/23】生成AI活用事例/研究開発-Weeklyまとめ

2023年6月24日 16:22

今週のAIに関する活用事例や研究開発の備忘録記事です。

活用事例

・「LINEのAIチャットくん、200万人の登録者数と6000万通の総メッセージ数を突破！」

AIチャットくんがなんと200万ユーザーを突破しました！！すごい！！これからもプロダクトの価値を高めるようなアプデを積み重ねていきます！/ LINEでChatGPTを使える「AIチャットくん」登録者数200万人、総メッセージ数6000万通を突破！ https://t.co/foP7mB0Trg @PRTIMES_JPより
— 山口翔誠 / AIイラストくん・AIチャットくん (@shosemaru) June 22, 2023

・AGC社、社内向けチャットツール「ChatAGC」を導入決定、マイクロソフトの「Azure OpenAI Service」を活用
「ChatAGC」がガラス最大手AGC社で導入決定
-マイクロソフト「Azure OpenAI Service」を活用した社内向けサービス
https://ledge.ai/articles/agc_chatagc… via @Ledge.ai

・DropboxがAIツールDashを開始し、ユニバーサル検索エンジンを提供
DropboxがAIツールDashを開始
あらゆる場所であらゆるファイルを一度に検索することが可能
Dropbox内のファイルだけでなく接続されているアプリのすべてにアクセスできるユニバーサル検索エンジン

・生成AIによるコスト改善は4つの業務に集中し、業種によって異なる。

生成AIによるコスト改善インパクトの75%は 4つの業務に集中。①営業・マーケ、②ソフトウェア開発、③顧客対応、④研究開発の4領域はコスト削減額・幅が大きい。また、生成AIによるコスト改善インパクトは業種によって異なる。ここから分解したユースケースは洪水のように出てくるので別途整理します pic.twitter.com/QdobRinIg3
— 大植択真@エクサウィザーズ /『Web3時代のAI戦略』 (@exa_ouetakuma) June 20, 2023

・AIスタートアップやテック企業で使用される新しいシステム、ツール、設計パターンの例
AI スタートアップやテック企業で使用されているシステム、ツール、設計パターン例
https://a16z.com/2023/06/20/emerging-architectures-for-llm-applications/… #tech @a16zから

・「ソフトバンクＧ、社内でAIコンテストを実施　優勝賞金1000万円」

"ソフトバンクＧ社内で生成ＡＩを活用するコンテストを実施したことを明らかにした。提案は10日間で５万2000件あり、優勝賞金は1000万円だという。今後毎月実施する。"

ソフトバンクＧ孫社長、いよいよ反転攻勢へ－手元に５兆円超 - Bloomberg https://t.co/IHTN0XhLk9
— 金子剛士 / East Ventures (@evkaneko) June 21, 2023

・EC事業者向けAI商品写真生成SaaS「フォトグラファーAI」を提供するエンジニア集団

EC事業者向けAI商品写真生成SaaS「フォトグラファーAI」の提供をしている鈴木さんはプログラム期間中にアイデアからリリースまで一気に駆け抜けたエンジニア集団です！

ぜひ、フォトグラファーAI、使ってみてください！

▼サービスサイトhttps://t.co/PCYKC6MAu5 https://t.co/sR5VlIr3A6 pic.twitter.com/03VI6jLl7c
— 大久保🛒コマース特化型VC共同代表 (@Koheei_Okubo) June 21, 2023

・SnapchatのAIチャットボットがターゲット広告に活用可能に

SnapchatのAIチャットボットは後にターゲット広告に活用できるとCEOのEvan Spiegelさんが語る。

既に1.5億人がSnapchatのMy AIチャットボットを利用、特定のブランドやトピックについての会話が行われている。https://t.co/ntfbvoMKkM
— Tetsuro Miyatake (@tmiyatake1) June 21, 2023

・MetaがAI投資する領域を発表 - AIアシスタント、AIステッカー、AIメディア編集に注力

Metaが今後のAI投資する領域について説明。

・AIアシスタント：複数のAIを人は使うと仮説している
・AIステッカー：パーソナライズされたステッカーを作れる
・AIメディア編集：画像だけではなく、動画生成技術に投資https://t.co/fhaSMEsgUz
— Tetsuro Miyatake (@tmiyatake1) June 21, 2023

・Epic Games、MetaHuman Animatorを発売 - 高品質な人間の顔を数分でアニメーション化可能
-Epic Games、iPhoneで高品質な人間の顔を撮影する「MetaHuman Animator」を発売
-iPhoneとPCだけで、アニメーションまで数分で完了
https://unrealengine.com/ja/blog/delivering-high-quality-facial-animation-in-minutes-metahuman-animator-is-now-available…

MetaHuman Animator is here to help you unlock the storytelling power of high-fidelity facial animation.

From performance to animation in minutes, with just an iPhone and a PC!

It's available now! Learn more: https://t.co/qRyiQj7FkQ pic.twitter.com/q5roMJ7974
— Unreal Engine (@UnrealEngine) June 15, 2023

・「Azure OpenAI Service」に新機能「On Your Data」が追加され、チャットAIがローカルやAzure上のストレージに保管されたファイルを参照可能に
「GPT-3.5」などのAPIをクラウドサービス「Microsoft Azure」上で使える「Azure OpenAI Service」に、新機能「On Your Data」を追加
ローカルやAzure上のストレージに保管するテキストファイルやPDF、PowerPointファイルを、GUIの操作でチャットAIに参照させられる
https://itmedia.co.jp/news/articles/2306/20/news196.html…

「社内のアレ分からん、教えてAI」実現　Microsoftの“自社版ChatGPT作成サービス”にデータ取り込み機能https://t.co/pdDSNueNcl
— ITmedia NEWS (@itmedia_news) June 20, 2023

・Microsoftが自社版ChatGPT作成サービスにデータ取り込み機能を追加

「社内のアレ分からん、教えてAI」実現　Microsoftの“自社版ChatGPT作成サービス”にデータ取り込み機能https://t.co/pdDSNueNcl
— ITmedia NEWS (@itmedia_news) June 20, 2023

・OpenAI、AIモデルのマーケットプレイスを検討

OpenAIがAIモデルを販売できるマーケットプレイスをローンチすることを検討している。

AIモデルのアプリストアを出すのはOpenAIからするとよりプラットフォーム化に向けての動きと思われるのと、OpenAIのパートナーであるSalesforceやMicrosoftと競合することになる。https://t.co/fRIbKuYTtZ
— Tetsuro Miyatake (@tmiyatake1) June 20, 2023

・Character Creatorのプラグイン最新アップデートで、写真や3Dモデルから高品質な頭部3Dモデルを構築可能に

Headshot 2 - AIの力で写真や3Dモデルから高品質な頭部3Dモデルを構築可能！Character Creatorのプラグイン最新アップデートがリリース！https://t.co/t3QuT2P0oa #3dnchu #Reallusion #CC4 #CharacterCrreator #Headshot pic.twitter.com/PQEHM3DXK3
— 3D人-3dnchu- CG情報ブログ (@ymt3d) June 20, 2023

・英ガーディアン誌、企業にAI利用方針の明確化を促す

英ガーディアン誌が生成AIの利用を表明。企業にとって社員にただ使わせてる時期は終わり、AIの利用方針やリスク対応を固めて、社会やユーザーに説明すべきフェーズに入って来た。https://t.co/CSM6IJGOUO
— 久保田雅也@ベンチャーキャピタル (@kubotamas) June 19, 2023

・生成AIを使用して合成データセットを構築することができるParallel DomainのAPI
ちなみに、Parallel Domainは合計約4400万ドル調達済み
https://tcrn.ch/3PiVGw0 via @techcrunch

生成AIを使用して合成データセットを構築することができるParallel DomainのAPI
ちなみに、Parallel Domainは合計約4400万ドル調達済みhttps://t.co/dHDY8Tr9Qq via @techcrunch
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 20, 2023

・Gatebox技術を活用した24時間接客可能なAIキャラクター派遣サービスが登場

【AI、バイト始めます】
接客用AIキャラクター派遣サービス「AIバイト」を法人向けに提供します！
Gateboxの技術で、ChatGPT連携のAIキャラクターが店頭で接客するサービスを作りました。
24時間365日働けます！https://t.co/pQ20jCf3gN
— 武地実 @Gatebox コンテンツ東京出展 (@takechi0209) June 20, 2023

・Vimeo、AIを活用した編集機能を導入

Vimeo、AIを活用した編集機能3種を導入
-ユーザーが台本を作成し、映像を録画し、録画から長い間や「ahs」や「ums」のような不要部分を削除するのを助けるように設計されたAI搭載のツール群を発表
-月額20ドル（年間課金）のVimeoのスタンダードプランの一部https://t.co/dqIVW8yqVb via @techcrunch
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 20, 2023

・Adobe、生成AI『Firefly』をPhotoshopなどに追加し、『Adobe Express』に注力

大手テクノロジー企業のAdobeが、生成AIに関する取り組みを本格化しています。

今年3月には生成AI『Firefly』を発表。現時点ではベータ版ですが、早速Photoshopなどの各製品にFireflyの機能を追加しています。

中でも力を入れるのが『Adobe Express』。… pic.twitter.com/XW9vzUPXEb
— Strainer（ストレイナー） (@strainerjp) June 19, 2023

・AIを活用した網膜スキャンで主要心血管イベントを精度高く予測可能に

Google CEOのSundar PichaiがAIを活用して網膜スキャンで主要心血管イベントをかなり精度高く予測できるのが分かった。

これにウヨってCTスキャンやMRIなどを使わずに患者の状況を理解できる可能性が出てくる。 pic.twitter.com/sQB3CwjC74
— Tetsuro Miyatake (@tmiyatake1) June 19, 2023

・IBMとAdobeがAI技術を活用したコンテンツサプライチェーンソリューションを開始

まさかのタッグ。

IBMとAdobeが協力、AI技術を活用したコンテンツサプライチェーンソリューションを開始

* Sensei GenAIサービスとAdobe Firefly等を活用。
* Adobeのエンプラ顧客が、IBM Consultingパーティーションを利用。https://t.co/Pq2dV8UBVT
— 深津貴之 / THE GUILD / note.com (@fladdict) June 19, 2023

・「AIエージェント」について解説する記事

私がここ数ヶ月夢中になっている「AIエージェント」について解説する記事を書きました！
AIエージェントは超超超面白いので、作る人が一人でも増えたら嬉しいです🙌https://t.co/tAYVWJjd53
— Dory | AI Agent (@dory111111) June 19, 2023

・AIが作った女性の動画が話題に

この動画の女性、実は完全に0からAIで作られている。

提供しているのは、最近時価総額1000億円を超えユニコーンとなったAI企業のSynthesia。

これはもう全く見分けがつかない…

pic.twitter.com/UICRXg2OD9
— usutaku@AI情報解説 (@usutaku_com) June 17, 2023

・LLM基盤モデル開発事業の強みはデータセットとマーケットリーダーになれるチームの構築

LLMの基盤モデル開発を事業とする場合
・独自の大規模で整理されたデータセットがある。
・現状の最先端の実装だけでなく、今後の新たな手法を生み出せる、マーケットリーダーになれる蓋然性高いチームを構築できている。…
— 松本勇気 | LayerXはSaaS+Fintechの会社です (@y_matsuwitter) June 17, 2023

・メルセデス、米国でチャットGPT試験を実施

独メルセデス、米国でチャットＧＰＴ試験搭載 https://t.co/VJuNpJrTme
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 17, 2023

・京都の左官業界でStable Diffusionを取り入れた株式会社スタッコプラス

京都に本社を構える株式会社スタッコプラス様(https://t.co/kk01edIf9x)は左官業という伝統的な業界でいち早くStable Diffusionを取り入れていらっしゃいます。AIの中だけと思っていた理想のお部屋が現実化されるなんて夢みたいですよね。#StableDiffusion #生成AI pic.twitter.com/Prb2ZXQLSM
— Stability AI 日本公式 (@StabilityAI_JP) June 16, 2023

・韓国のバーチャルアイドルの多様性

韓国のバーチャルアイドルは、色々な形が模索されてる
-全員AIのMAVE
-リアルメンバーとメタユニバース内のAIアバター(ae)で構成されたメタユニバースガールズグループのaespa
-キャラ生成AIによるグループETERN
-バーチャルリアル統合ボーイグループのスーパーカインドhttps://t.co/QjtGNmKu4K https://t.co/PTwVZpSXjX
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 17, 2023

・ChatGPTを旅ガイドにしたAVA Travelのチームワーク

ChatGPTを「旅ガイド」にしたAVA Travelーーカムスタ！チームワークのお話https://t.co/hu9fxNciIs
— BRIDGE（JP） (@thebridge_jp) June 23, 2023

・AIとデジタルヒューマンが手掛けるライブコマース店舗「Lumiwink」が16万人の注目を集める

【こぼれ話】先日の618セールでデザイン、ネーミング、装飾、商品デザイン、マーケティングをAIが行い、デジタルヒューマン「馬斯氪」がライブコマースで販売する店舗が登場しました。36Kr（中国）による店舗「Lumiwink」で2時間で16万人が視聴。多くの人の関心を集めましたhttps://t.co/DEmzQcVosX pic.twitter.com/HyCtKkKZBL
— 36Kr Japan@中国テック・スタートアップ専門メディア (@36krJ) June 23, 2023

・アクセンチュアがプライベートGPTを構築し、自社業務や顧客への導入支援を開始

“アクセンチュアではすでにプライベートGPTともいえるジェネレーティブAIの環境を構築し、自社での業務への提供や顧客への導入支援を開始している”とのこと。

アクセンチュアが推進する「EnterpriseGPT」とは？プライベート型ジェネレーティブAIの構築と運用の勘所https://t.co/8NrNXNTa2C pic.twitter.com/zMeFbsYlLl
— コンサルマン (@mr_grayhair) June 23, 2023

・みずほと富士通、AIを活用したシステム開発の実証実験を開始

みずほ、システム開発保守に生成AIを活用。富士通と実証実験を開始

>設計書の記載ミスや漏れを自動で検出し、システム開発の品質を向上させることを目的とし、ソースコードの生成をAIが代替できるかを検証する予定。実験は2024年3月31日まで行われるhttps://t.co/AC2FXzkotI via @Ledge.ai
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 23, 2023

・「a16z調査：243のゲームスタジオの87%がAIを使用中、ChatGPTが最も人気」

大手VCのa16zのAIとゲームスタジオについての調査。243の大小スタジオに利用を聞いたところ87%が“現在”使用中。ChatGPT 89%、Midjourney 71%、StableDiffusion 52%が使用される生成AIトップ3。 https://t.co/x4GSkpCsl6
— 新清士@(生成AI)インディゲーム開発者 (@kiyoshi_shin) June 22, 2023

・AmazonのAWS、AI関連企業に$100Mの資金提供プログラムを発表

AmazonのAWSがAI生成技術や関連する会社に$100Mほど資金提供するプログラムを立ち上げたことを発表。https://t.co/xy2rcNZD8X
— Tetsuro Miyatake (@tmiyatake1) June 23, 2023

・それはコンピューターではない、コンパニオンなのだ by a16z

それはコンピューターではない、コンパニオンなのだ by a16z

インフルエンサーのCarynが作成したチャットボットCarynAIを始め、単なる1対1の会話を超え、友人や家族との関係に溶け込んでいるAIコンパニオンの周辺情報に関して

(続きはスレッド)https://t.co/eYu3eYhbTa
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 23, 2023

・YouTubeがAIによる吹き替えを導入

YouTubeがAIによる吹き替えを導入
また、吹き替え音声をクリエイターの声のように近づけたり、唇の動きも吹き替えに合わせる機能を2024年に計画https://t.co/xL3AYoBce0
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 23, 2023

・Figmaの新機能「Genius」がチャットインターフェースでUIを段階的に生成可能に

Figmaに搭載される、テキスからUI 生成するGeniusのデモ動画を見るに...
競合サービスと違い、チャットインターフェースで段階的にパーツレベルで生成することができるのがとても良い。pic.twitter.com/Ch4MxmWdEC https://t.co/y4dSoq1OEC
— しょーてぃー / Experience & Prompt Designer (@shoty_k2) June 22, 2023

・GoogleのDuet AIがスプレッドシートでカスタムテンプレートを作成可能に

GoogleのDuet AIはスプレッドシートでも使えるようになり始めた。

どんなシートを作りたいのかをテキストで入力するとカスタムテンプレをAIが作ってくれる。https://t.co/lapGu6Xfgm pic.twitter.com/dNoPPzms2w
— Tetsuro Miyatake (@tmiyatake1) June 23, 2023

・AGC社、社内向けチャットボット「ChatAGC」を導入決定、マイクロソフトのAIサービスを活用

「ChatAGC」がガラス最大手AGC社で導入決定
-マイクロソフト「Azure OpenAI Service」を活用した社内向けサービス
https://t.co/T0Q380wNRx via @Ledge.ai
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 22, 2023

研究開発

・LangChainが新機能を追加、OpenAI Multi Functions Agentを導入

LangChainまたまた新機能: OpenAI Multi Functions Agent｜はまち @hama_jp #note #AIとやってみた https://t.co/1Fj2wKxU7z
— はまち (@hama_jp) June 21, 2023

・CrestaがAIを活用した世界初のコンタクトセンター基盤モデル「Ocean-1」を発表
Ocean-1 : 世界初のコンタクトセンター基盤モデル
-合計1億5100万ドル調達し、AIで顧客サービスの品質向上を支援するCrestaから
-これまで蓄積したコンタクトセンターのドメインデータやフィードバックを利用し作成
https://cresta.com/blog/introducing-ocean-1-worlds-first-contact-center-foundation-model/…

Today, We introduced Ocean-1, a foundation model for the contact center.

It's the culmination of our experience in generative AI for large enterprises and our latest milestone in advancing the cutting edge for customer facing conversations.https://t.co/2jmYmyG2oN pic.twitter.com/8Z3D7zaQN7
— Tim Shi (@timshi_ai) June 21, 2023

・M1/M2 MacでローカルLLMが2倍速く
LLaMAの全モデルをサポート
デモは、16GBのRAMを搭載したM2 Macbook Pro上で動作する13BパラメータのLLM
http://gpt4all.io

M1/M2 MacでローカルLLMが2倍速く
- LLaMAの全モデルをサポート
- デモは、16GBのRAMを搭載したM2 Macbook Pro上で動作する13BパラメータのLLMhttps://t.co/2MXJitj6tu https://t.co/fhCbRtFTNE pic.twitter.com/oKbFKgNnF9
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 21, 2023

・FastSAMが50倍高速化し、SAM手法と同等の性能を達成
おーーー
SAMの高速化版！FastSAM！
50倍の実行速度でSAM手法と同等の性能を達成
モデルは変わらずApache 2.0 license
huggingface: https://huggingface.co/papers/2306.12156…
github: https://github.com/CASIA-IVA-Lab/FastSAM…

Fast Segment Anything

paper page: https://t.co/zvrNniWr5C

The recently proposed segment anything model (SAM) has made a significant influence in many computer vision tasks. It is becoming a foundation step for many high-level tasks, like image segmentation, image caption, and… pic.twitter.com/s1csd34Z35
— AK (@_akhaliq) June 22, 2023

・ LLMライブラリの評価結果

個人的LLM周りのライブラリ等の評価

「LangChain」
長所:昨日出た論文の機能が今日できてるみたいな速度感。
短所:抽象度が高く、コードの深い部分の変更を行おうとするとソースが汚くなりがち。バグが多い。

「guidance」
長所:LLM出力の構造化。…
— 智基/Tomoki@REIMEI CEO (@tomolld) June 21, 2023

・「Multi-modal LLM」は大規模事前学習モデルのマルチモーダル化に焦点を当てたメタサーベイ

VandL / VideoRecog Groupによるメタサーベイ「Multi-modal LLM」が公開されました！大規模事前学習モデルのマルチモーダル化を中心に調査されています。 https://t.co/DYa0PcquhI pic.twitter.com/ec3yKkgQRa
— Hirokatsu Kataoka | 片岡裕雄 #CVPR2023 (@HirokatuKataoka) June 21, 2023

・「MAGVIT：10種類の動画生成タスクに対応するトランスフォーマー」MAGVIT: イメージアニメーション、動画編集、アウトペイントを含む10種類の動画生成タスクに対応するトランスフォーマー
github(まもなく): https://github.com/MAGVIT/magvit
詳細: https://magvit.cs.cmu.edu

Introducing MAGVIT, a single transformer designed to address ten video generation tasks, including future image animation, video editing and video outpainting. Stop by the #CVPR2023 Google booth at 10am today to see it in action! More details at: https://t.co/nd7Gew2ozv pic.twitter.com/8J35j5fnIG
— Google AI (@GoogleAI) June 21, 2023

・ FLAN命令データセットを使用したOpenLLaMAモデル、Flan-Open-Llama-7bがリリースされる。商用利用にはPROスペースまたは推論エンドポイントが必要。
FLAN命令データセットでチューニングされたOpenLLaMAモデル、Flan-Open-Llama-7bをリリース
下から使えるが、モデルが大きいので、商用利用の場合は、PRO スペース、または推論エンドポイントが必要
https://huggingface.co/conceptofmind/Flan-Open-Llama-7b…

Releasing Flan-Open-Llama-7b, an OpenLLaMA model fine-tuned on the FLAN instruction dataset. https://t.co/CLb3yiwOMH
— Enrico Shippole (@EnricoShippole) June 21, 2023

・Facebookが公開した多言語音声認識のコードとモデル
Metaの大規模多言語音声（MMS）プロジェクトのコードとモデル
プロジェクト: https://ai.facebook.com/blog/multilingual-model-speech-recognition/…
github: https://github.com/facebookresearch/fairseq/tree/main/examples/mms…
model: https://huggingface.co/models?other=mms…
※ただ、コードとモデルはCC-BY-NC 4.0ライセンス

Meta AI released Scaling Speech Technology to 1,000+ Languages

demo: https://t.co/1yMek3Uzbl

Expanding the language coverage of speech technology has the potential to improve access to information for many more people. However, current speech technology is restricted to about… pic.twitter.com/BHmA7J5YnW
— AK (@_akhaliq) June 21, 2023

・Metaが新たに開発した音声認識AI「MMS」は1,406言語に対応、デモも公開中

Metaの新開発した音声認識AI「Massively Multilingual Speech（MMS）」

1,406言語の事前学習済みwav2vec 2.0モデル、1,107言語に対する自動音声認識、音声合成モデル
更に言語識別なら4017言語にも及ぶと
デモもありもう実際に使える https://t.co/itDfKgxjmF
— 刈宮宥 (@Callimiya) June 21, 2023

・DB-GPT: プライバシー保護されたデータベースインタラクションの革新DB-GPT: プライベートLLMによるデータベースインタラクションの革新
-ローカライズされたGPT largeモデルを使用して、データと環境と対話する実験的なOSSプロジェクト
-データ漏洩のリスクはなく、データは安全であることを保証可能とのことGithub: https://github.com/csunny/DB-GPT

DB-GPT: Revolutionizing Database Interactions with Private LLM Technology

github: https://t.co/4uLnpUGxAM

As large models are released and iterated upon, they are becoming increasingly intelligent. However, in the process of using large models, we face significant challenges in… pic.twitter.com/4UdYsVomV3
— AK (@_akhaliq) June 21, 2023

・画像の全領域を一度にセグメンテーションする対話型モデルSEEMの提案Segment Everything Everywhere All at Once
-画像内のあらゆる場所を一度にセグメンテーションするためのプロンプト可能な対話型モデルであるSEEMを提案
論文: https://arxiv.org/abs/2304.06718
デモ: https://36771ee9c49a4631.gradio.app
(なぜかデモアクセスできない)

Segment Everything Everywhere All at Once

abs: https://t.co/npJ6Kf25aa @Gradio demo: https://t.co/mRrrfvwBX7 pic.twitter.com/ipH1GKLsAl
— AK (@_akhaliq) April 14, 2023

・Automation AnywhereがAWSと提携し、企業内業務の自動化を促進
RPA大手Automation AnywhereがAWSと提携、生成AIで企業内業務の自動化促進
GCPやAWSと連携し、Automation Co-Pilot + Generative AI、オートメーター向けのAutomation Co-Pilot + Generative AI、ドキュメントオートメーション + Generative AI などを発表する予定

・ LLMによるフィルタリングと生成で高性能を達成

LLMの学習ではデータの質が重要であり、明確、自己完結、有益でバランスされている「教科書」のようなデータと微調整用「練習問題」を既存LLMによるフィルタリングと生成で用意。結果のphi-1は1/10のモデルサイズ、1/100のデータ量でコード向け既存OSS LLMを超える性能を達成 https://t.co/Gg3Gc3bwKv
— Daisuke Okanohara / 岡野原大輔 (@hillbig) June 21, 2023

・ロボティクス基盤モデルにおけるLLM/LVMの調査と応用

「大規模言語・視覚モデルを用いたロボティクス基盤モデル」を公開しました！大規模言語モデル（LLM）/大規模視覚モデル（LVM）に関する調査、そのロボティクス応用について調査・メタ分析しています。ChatGPT （含：GPT-4）も一部説明あります。 https://t.co/kCIHIUpJMs pic.twitter.com/Cn3AhNGJgA
— Hirokatsu Kataoka | 片岡裕雄 #CVPR2023 (@HirokatuKataoka) June 21, 2023

・「visionOSのSDKがXcode 15 beta 2に追加されました」

visionOSのSDKがご利用いただけるようになりました！Xcode 15 beta 2に、Reality Composer ProもvisionOSシミュレーターも含まれておりますので、是非お試しください！！ドキュメントやサンプルコードもご利用いただけます！https://t.co/k7By6yvmmj
— Masashi Toyota (@toyochang) June 22, 2023

・OpenAIのFunction callingを使った小説解析

Function callingに興奮したので思わずnoteにまとめました。

OpenAIのFunction callingで小説の解析をしてみる｜松xRのnote #note https://t.co/eN3sH886zb
— 松xR (@matsu_vr) June 20, 2023

・「LLMアプリケーションの新しいアーキテクチャとツールについての見解」

Seemingly everyone wants to build LLM-based apps. But finding the right architecture and tooling can be difficult.

Here’s what @BornsteinMatt and @rajko_rad are seeing, including their current view of the LLM app stack 👇 https://t.co/EIXBqlaZjp pic.twitter.com/mpgpfYI4jj
— a16z (@a16z) June 20, 2023

・「CVPR2023のworkshopで、拡散モデルを使った高品質＆精緻な画像編集の高速＆省コスト実現方法を発表」

CVPR2023のworkshopにて、共著論文の発表（oralで採択）があります。https://t.co/RCGzlxSNyj

拡散モデルを使った高品質＆精緻な画像編集を、高速＆省コストに実現する方法を提案しています。ご興味のある方はぜひ！（ちなみに筆頭は昨年度の新人で、初年度に取り組んだ研究をまとめたものです） https://t.co/xKixRIh8mh pic.twitter.com/F4vKgjcbHg
— mi141 (@mi141) June 13, 2023

・CVPRでアニメキャラの3D復元が実現

今年のCVPRにアニメキャラの三次元復元があったらしい。へー、通るもんなんだ。こういうのACMMMが巻き取ると思っていたのだが。https://t.co/0Dxi6uU8wJ pic.twitter.com/i5vYHYoHJP
— あるふ (@alfredplpl) June 21, 2023

・GPTモデルの信頼性に脆弱性があることが判明
DecodingTrust: GPTモデルにおける信頼性の包括的な評価
-信頼性の脅威に対するこれまで知られていなかった脆弱性を発見

DecodingTrust: A Comprehensive Assessment of Trustworthiness in GPT Models

paper page: https://t.co/k1dBVKFjTd

Generative Pre-trained Transformer (GPT) models have exhibited exciting progress in capabilities, capturing the interest of practitioners and the public alike. Yet,… pic.twitter.com/HfONAQgyT8
— AK (@_akhaliq) June 21, 2023

・Meta AIがCVPR2023で発表した論文に注目

#CVPR2023 — Here are 6️⃣ Interesting new papers you should know about from Meta AI — and how you can access them if you’re not at the conference.

🧵
— Meta AI (@MetaAI) June 20, 2023

・「生成AIが作った文章」を学習させ続けると破綻する可能性がある

生成AIに“生成AIが作った文章”を学習させ続けるとどうなる？　「役立たずになる」と英国チームが報告 https://t.co/RupPA6cEfu ネット上に言語生成AIが作成した似たような文章が氾濫し,それらを学習する新言語生成AIがデータの多様性が確保されない学習となり破綻する。回避には人が書いた文章が必要。 pic.twitter.com/pfRRyE5jvb
— Seamless (@shiropen2) June 21, 2023

・GPT-4は1.76兆パラメータの混合モデルであることがリークされる

GPT-4に関する特大のリーク情報
MetaのPyTorchの開発リーダーも認めている&似た話が一部で共有されていた,ということで結構確度は高いです
曰く，
"GPT-4は220Bパラメータのモデル８つ（2200億x8 = 1.76兆パラメータ）からなる混合モデルで,各モデルは別のデータ/タスクで学習している"
とのこと… https://t.co/tCgNDJ3nPM
— 今井翔太 / Shota Imai@えるエル (@ImAI_Eruel) June 21, 2023

・Inflection.Aiの創設者が新しいチャットボットのテストを提案
パーソナルAIアシスタントを開発するhttp://Inflection.Aiの創設者スレイマンがチャットボットの新しいチューリングテストを提案

・Baichuan Intelligent Technologyが開発したオープンソースLLMが高性能を発揮
baichuan-7B
-Baichuan Intelligent Technologyが開発したオープンソースLLM
-Transformerアーキテクチャに基づき、約1.2兆個のトークンで学習
-中国語と英語の両方をサポート
-コンテキストウィンドウは4096

baichuan-7B

model on @huggingface: https://t.co/pueNVAgZ9u

baichuan-7B is an open-source large-scale pre-trained model developed by Baichuan Intelligent Technology. Based on the Transformer architecture, it is a model with 7 billion parameters trained on approximately 1.2… pic.twitter.com/1Ce5VNrG1Q
— AK (@_akhaliq) June 20, 2023

・Infinigen - 自然界のフォトリアルな3Dシーンをプロシージャル生成するオープンソースツール
自然界のフォトリアルな3Dシーンをプロシージャル生成するInfinigen
-フリーでオープンソース(BSD 3-Clause License)
-形状からテクスチャまで、すべてのアセットがランダムな数学的ルールによってゼロから生成

Infinite Photorealistic Worlds using Procedural Generation

paper page: https://t.co/HiSl313uEN

introduce Infinigen, a procedural generator of photorealistic 3D scenes of the natural world. Infinigen is entirely procedural: every asset, from shape to texture, is generated from… pic.twitter.com/K1iGHwRaht
— AK (@_akhaliq) June 20, 2023

・vLLM - 高速なオープンソースのLLM推論および処理ライブラリ
-オープンソースのLLM推論および処理ライブラリ
-HuggingFace Transformers を 24 倍高速化し、Vicuna と Chatbot Arena をパワーアップ
-中核のPagedAttentionは、モデル変更なく、5倍以上のシーケンスを一緒にバッチ処理可能
Github: https://github.com/vllm-project/vllm…
ブログ: https://vllm.ai

vLLM
-オープンソースのLLM推論および処理ライブラリ
-HuggingFace Transformers を 24 倍高速化し、Vicuna と Chatbot Arena をパワーアップ
-中核のPagedAttentionは、モデル変更なく、5倍以上のシーケンスを一緒にバッチ処理可能
Github: https://t.co/pVHGN4DCGQ
ブログ: https://t.co/XMAamIvqqz https://t.co/JGq3jBpZlb pic.twitter.com/STPpqi34zQ
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 21, 2023

・Google DeepMindがロボット操作のための自己改良型基盤エージェント「RoboCat」を発表

Google DeepMindがロボット操作のための自己改良型基盤エージェント「RoboCat」を発表。
100~1000の人間によるデモでRoboCatを微調整することで多様なロボットアームタスクを習得可能。
新しいロボットアームでのタスクにも汎化できる。
事前訓練時にはデモデータを用いて報酬関数を訓練し、 https://t.co/iL36elNhSR pic.twitter.com/IHyL59r6ls
— bioshok(INFJ) (@bioshok3) June 20, 2023

・「CVPR」で論文投稿数・採択数は過去最高を記録。最多出現ワードは「Diffusion model(拡散モデル)」
https://research-p.com/column/1237

近年、画像や動画や3Dなどの生成AIで革命的な発展を遂げてるコンピュータビジョン分野。そのトップ国際会議
「CVPR」で論文投稿数・採択数は過去最高を記録。最多出現ワードは「Diffusion model(拡散モデル)」https://t.co/HJ3QrRMnSb
「CVPR2023では9,155件の論文が投稿され、2,357件の論文が採択」 pic.twitter.com/0oxhYGEwKp
— 小猫遊りょう（たかにゃし・りょう） (@jaguring1) June 20, 2023

・RWKVにWIKIページが新設
https://wiki.rwkv.com

RWKVのWIKIページができていた。https://t.co/pyREYGQLRT
— masaoutiyama (@masaoutiyama) June 20, 2023

・チャット履歴を利用して、その質問が前の対話の続きなのか、それともまったく新しい質問なのかを判断

新しい文脈対応
チャット履歴を利用して、その質問が前の対話の続きなのか、それともまったく新しい質問なのかを判断@zahidali133 https://t.co/js4zxcNHLX pic.twitter.com/R7LeeF8bM0
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 20, 2023

・OWLv2を使った物体検出において40%の性能向上を実現

Check out OWLv2; leveraging large scale pre-training---which has been hugely potent for classification, captioning, & LMs---for object detection.

>40% (relative) performance improvement in the open-vocab setting. https://t.co/WNDPhSOMYC
— Neil Houlsby (@neilhoulsby) June 19, 2023

・ChatGPTに匹敵する商用版を今年中にリリース予定、将来的に日本語ベースのStable Diffusionを計画

>ChatGPTに匹敵する商用版を今年中にリリースする予定
>将来的に日本語ベースのStable Diffusionを作成する計画があるhttps://t.co/RBirFgZpdA
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 20, 2023

・「逆スケーリング」による性能低下の論文が発表される

GPTに関する話題で,個人的にかなり気になっていた「逆スケーリング」に関する論文が出てました
Inverse Scaling: When Bigger Isn’t Betterhttps://t.co/8TNNV0Efgk
LLMは普通,スケーリング則でサイズが大きくなると性能も良くなりますが,これらの「逆スケーリング」タスクでは逆に性能が下がります… pic.twitter.com/adwuFjH3Qo
— 今井翔太 / Shota Imai@えるエル (@ImAI_Eruel) June 20, 2023

・顔写真から化粧のパターンを抽出する研究がEurographics2023で採択される

■Research Blog公開■#AILab 研究員の楊が１枚の顔写真から化粧のパターンを抽出する研究として、#Eurographics2023 で採択された論文「Makeup Extraction of 3D Representation via Illumination-Aware Image Decomposition」について紹介しています。https://t.co/1AQ814qRi9
— CyberAgent AI事業本部広報 (@cyberagent_ai) June 20, 2023

・MagicBrush: 手順に従った画像編集のための大規模な手動注釈付きデータセット

🪄Introducing #MagicBrush, the first large manually-annotated dataset for instruction-guided image editing🎨

Proj: https://t.co/q9IdTF1zbK

MagicBrush has >10K editing turns, supporting various editing scenarios: multi-turn, single-turn, mask-provided & mask-free. https://t.co/hoJOX9IjMk pic.twitter.com/rq0tcpwu0i
— Kai Zhang (@DrogoKhal4) June 19, 2023

・SnapchatがAI画像生成モデル「SnapFusion」を開発

SnapchatがAI画像生成モデル「SnapFusion」を開発したことを発表。https://t.co/wUvO7n2ZQy https://t.co/dUl9884zO0 pic.twitter.com/EPihGlHVxG
— Tetsuro Miyatake (@tmiyatake1) June 20, 2023

・text-generation-webuiでRinna、OpenCALM、RWKVを試す

text-generation-webui で Rinna・OpenCALM・RWKV を試す｜npaka @npaka123 #note https://t.co/Vzqzqo0KBG
— 布留川英一 / Hidekazu Furukawa (@npaka123) June 19, 2023

・WizardLMとWizardCoderは、自動生成された指示により、LLMの微調整を改善

LLMを追加指示で微調整する際の指示は人手で作るのが多いが、網羅性の問題や人で作るのが難しい場合もある。WizardLM (https://t.co/jwJUgYhhiP) は基本指示を変化パターンに基づき指示を自動生成する。それがCodeに特化したWizardCoder (https://t.co/FrEHkcaTdU)は従来手法の性能を大幅に改善する
— Daisuke Okanohara / 岡野原大輔 (@hillbig) June 19, 2023

・NTTセキュリティが開発したChatGPT、98％以上の精度でフィッシングサイトを自動検出

ChatGPTでフィッシングサイトを自動検出する方法　NTTセキュリティが開発　精度は98％以上https://t.co/wTbE3aHyTd
— ITmedia NEWS (@itmedia_news) June 18, 2023

・Google ColabでPaLMを使用可能に

Google Colabで、PaLMを使うことができるようになりましたので試してみました。自然言語の中で変数を使うことができるのは大きな変化かと思います。 https://t.co/FmMAWr7Jag
— 阿部雅之 (@7QjuW9P8SpP7PUM) June 18, 2023

・OpenLLaMA 13Bモデルがリリース

OpenLLaMA 13B Released

model: https://t.co/u5ncJO05E4

present a permissively licensed open source reproduction of Meta AI's LLaMA large language model. We are releasing 3B, 7B and 13B models trained on 1T tokens. We provide PyTorch and JAX weights of pre-trained OpenLLaMA… pic.twitter.com/xTirdxPTnf
— AK (@_akhaliq) June 18, 2023

・「HQ-SAM」技術で超高精度な背景分離が可能に

虫の細い触角も抜き取れる。画像内の物体を超高精度で背景と分離する技術「HQ-SAM」 https://t.co/xSKtH4KXZG Meta開発のセグメーションモデル「SAM」を改良したハイモデル。蝶の触角やテニスラケットの網目,背景と同化する生き物まで境界を明確にして切り出す。 pic.twitter.com/ETI6XckWr1
— Seamless (@shiropen2) June 19, 2023

・RWKVとsqlite-vssを使った高速なベクトル検索の実装

やっぱりRWKVは早い。これもう少し活用できないかなと思って次元削除などをして挑戦してみました

RWKVとsqlite-vssで高速なベクトル検索を作ってみる｜Yusuke Hata https://t.co/d2SnR4NYS7 #zenn
— Yusuke Hata (@octu0) June 17, 2023

・Google Colabを使用してOpenCALM-largeのファインチューニングを試す

Google Colab で OpenCALM-largeのLoRAを使わないファインチューニングを試す｜npaka @npaka123 #note https://t.co/PisUpPrGcR
— 布留川英一 / Hidekazu Furukawa (@npaka123) June 18, 2023

・Google ColabでOpenLLaMA-13Bを試す方法

Google Colab で OpenLLaMA-13B を試す｜npaka @npaka123 #note https://t.co/8MpQQP9lR6
— 布留川英一 / Hidekazu Furukawa (@npaka123) June 18, 2023

・LLMとナレッジグラフの融合に向けたロードマップ提示

LLMとナレッジグラフ(KG)の融合
KG: Wikipediaなど、事実知識を明示的に保存する構造化された知識モデル

LLMとKGの統合に向けたロードマップを提示
1) LLMの事前学習・推論時にKGを組み込み、LLMの理解度向上
2) LLMを様々なKGタスク（埋め込み、補完、構築）に活用
3)… https://t.co/1AJgoSdbrN pic.twitter.com/Km6WEbvRtb
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 18, 2023

・東北大と理研が報告するAIによる英文校正の研究成果

英文校正promptで一番成績が良かったもの👇👇

Reply with a corrected version of the input sentence with all grammatical and spelling errors fixed. If there are no errors, reply with a copy of the original sentence.

東北大と理研からの報告https://t.co/GzLH3D4Dmf pic.twitter.com/BdqekUxwg2
— 限界助教|ChatGPTで論文作成と科研費申請 (@genkAIjokyo) June 17, 2023

・拡散モデル講演資料が公開

そういえば同僚が昨日講演した内容（拡散モデルの基礎と応用）についても、以下に資料が公開されていますので、気になる方はぜひ！https://t.co/RreX1mp8C6
— mi141 (@mi141) June 16, 2023

・Transformerモデルの包括的なサーベイ

Transformerを使ったモデルについての包括的なサーベイ。

Transformerはテキストはもちろん、画像、マルチモーダルモデルなど、幅広く応用されてる。

ものすごいスピードで発展してるTransformerモデルの全体感整理に使えそう。
時間がある時に読んでおきたい論文。https://t.co/U574VKk0Gu pic.twitter.com/xxdB3Vq3BQ
— すえつぐ｜自然言語処理（NLP） (@NLP_sue) June 16, 2023

・「function calling」の使い方と例について

開発知識が必要になりますが最近公開された function calling のイメージと具体的な例がわかるとても良い記事でしたhttps://t.co/nFmaXbkXIv
— 吉田塁 | Lui Yoshida (@luiyoshida) June 17, 2023

・NTTと早大、誤った正規表現の文字列抽出を自動で修正する技術を発表

NTTと早大、誤った正規表現の文字列抽出を自動で修正する技術を発表 - ZDNET Japan https://t.co/UIXPF0KA2Q @zdnet_japanより
— AI 人工知能ニュース (@ai_news_jp) June 17, 2023

・クラウドソーシングの人間アノテータがGPTなどを使用している可能性

とんでもタイトルの論文が出てたので読んでみると面白かった
Artificial Artificial Artificial Intelligencehttps://t.co/yfPj2jhZLD
既に4~5割近いクラウドソーシングの人間アノテータがこっそりGPT等のLLMを使っているのではという話…
— 今井翔太 / Shota Imai@えるエル (@ImAI_Eruel) June 17, 2023

・gen関数の解説とアップデート情報

https://twitter.com/mah_lab/status/1669985755114897408

・LangChainが新機能「Tagging」を導入

LangChainの新機能Taggingを試す｜はまち @hama_jp #note https://t.co/eg593RpRHF
— はまち (@hama_jp) June 17, 2023

・Livedoorニュースコーパスを簡単に呼び出せるhuggingface datasetsが登場

日本語の NLP で入門的に扱われる Livedoor ニュースコーパスを、実はこっそり huggingface datasets 🤗 にして簡単に呼び出せるようにしていました。いざ書くと微妙に面倒くさい読み込みを、かなり簡単にします！

🤗 https://t.co/X84G5eJ5xh
🐙 https://t.co/c5HSFSuSf2
📝 https://t.co/Bcvsi4Y1Xg pic.twitter.com/tHmyQqvvvu
— しゅんけー (@shunk031) June 17, 2023

・Robin-V2シリーズのモデルがLLMベンチマークで高得点を獲得

🎉Exciting news!🎉 Our finetuned Robin-33B-V2 scored an impressive 64.1 on the @huggingface LLM leaderboard in our offline evaluation! 🔍Check out our Robin-V2 series models, including 7B, 13B, 33B, and 65B versions. Upgrade your language modeling game today! #NLP #LanguageModels https://t.co/oLO3x4bqVS pic.twitter.com/9nnPIZ3BE1
— Shizhe Diao (@shizhediao) June 16, 2023

・Huggingface hubにてRobinモデルのチェックポイントを公開

Hi,
Thanks for your attention!
We have released all of these checkpoints at huggingface hub. Please try it out:
Robin-65b-v2: https://t.co/XDKKCEjFre
Robin-33b-v2: https://t.co/L7x9icCYBU
Robin-13b-v2: https://t.co/quvLtGtxBO
Robin-7b-v2: https://t.co/mzomoElS6k
— Shizhe Diao (@shizhediao) June 16, 2023

・テキストから動画変換可能なゼロショット技術のデモ

ゼロショットで、テキストによる動画変換
デモ: https://t.co/4Kaq9Lmipa https://t.co/ZDq9Rzk3DR pic.twitter.com/R68BE9nunP
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 17, 2023

・Googleが開発したテキストから3Dアバター生成

DreamHuman：テキストからアニメーション可能な3Dアバター生成論文 by Google
プロジェクト: https://t.co/K7qrJ7RsOn
論文: https://t.co/rmr1MDX2PL https://t.co/k6Vuc8A95X pic.twitter.com/7skWWNxbTu
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 17, 2023

・MiniLLMによる大規模言語モデルから小規模言語モデルの抽出

大規模言語モデルの知識蒸留
- 大規模言語モデルから小規模言語モデルを抽出するMiniLLMを提案
- 120Mから13Bのパラメータを持つ様々なモデルに対応
github: https://t.co/FQPFdpUElx
論文: https://t.co/9l0dTOKgL7 https://t.co/5PWc9YXhsZ pic.twitter.com/AlHeKoqQwk
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 17, 2023

・新しい仮想試着モデル「TryOnDiffusion」にParallel-UNetアーキテクチャを提案

新しい仮想試着モデルのTryOnDiffusion
2つのUNetを統合した拡散ベースのアーキテクチャParallel-UNetを提案https://t.co/p6tHOXjYZX https://t.co/IerWWTMW5M pic.twitter.com/oDmckXqoRe
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 16, 2023

・Googleが拡散モデルベースの仮想試着研究を発表

Googleより、拡散モデルベースの仮想試着研究ブログhttps://t.co/buR8NAFPEJ https://t.co/F0c4sR2LEs pic.twitter.com/zYyz5rRQOv
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 16, 2023

・多言語音声合成モデルVoicebox

汎用性の高いテキストガイドの多言語音声合成モデルVoicebox https://t.co/xIznogVuMq
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 16, 2023

・大規模言語モデルは因果関係を推定できない？研究者が40万個の問題で調査

・HuggingFace版Whisperに単語レベルのタイムスタンプが追加

HuggingFace版Whisperに、単語レベルのタイムスタンプを追加https://t.co/V8XUgy41Ai https://t.co/MbV5w1EUrR
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 23, 2023

・Inflection AI、会話APIを通じてInflection-1を利用可能に。広範なベンチマークで上回る

Inflection AIが、https://t.co/zsHntk274Sを支える社内LLMであるInflection-1を会話APIを通じて利用可能に
-広範なベンチマークでGPT-3.5、LLaMA、Chinchilla、PaLM-540B を上回るhttps://t.co/yhsdS9iq1h pic.twitter.com/unF8iXbAip
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 23, 2023

・音声理解と生成にの大規模言語モデルAudioPaLM

音声理解と音声生成のための大規模言語モデルAudioPaLM
-テキストベースの言語モデルPaLM-2と、音声ベースの言語モデルAudioLMを統合
-テキストと音声を処理・生成し、音声認識や音声翻訳などのアプリケーションに利用https://t.co/SBb67Oc08G https://t.co/4QStwKzPsr pic.twitter.com/9JogTLclzV
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 23, 2023

・画像の視覚的特性を保持したレイアウト編集手法

拡散モデルを用いた画像の連続レイアウト編集
-画像の視覚的特性を保持しながらレイアウト編集を行う手法を提案
-コードは、また公開予定
論文: https://t.co/TnRjiEQ6aq https://t.co/0liDLJX9mF pic.twitter.com/uDNeO2dR31
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 23, 2023

・StableAI、SDXL 0.9をリリース

StableAIが、Stable Diffusionの最新バージョンSDXL 0.9をリリースhttps://t.co/D3fwRUkgEA https://t.co/VnKP4j6Zvu pic.twitter.com/KNiTSjBaIP
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 23, 2023

・wanda: LLMの50%枝刈りで精度劣化少ない手法の提案と、4bit近くに量子化することでfp16の1/8サイズに圧縮可能性の検証

LLM の重みを 50% 枝刈りしても精度の劣化の少ない手法 wanda が提案された。

4bit 近くに量子化する手法はいくつかでているので、併せて適用することができれば、理論上 fp16 の〜1/8 のサイズに圧縮することができる。 https://t.co/CJOOp8EvPp
— Kai INUI (@_kaiinui) June 22, 2023

・StyleSync - リップシンクを高精度に実現するフレームワーク

StyleSync
忠実度の高いのリップシンクを可能にするフレームワーク

論文: https://t.co/nZw63ozfkw
プロジェクト: https://t.co/fzhEkprs5a
Github: まもなく https://t.co/dbpp0jqM50 pic.twitter.com/u2JY4hImU9
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 22, 2023

・MPT-30B: 商用利用可能なオープンソース最新モデル、最大8000コンテキストの1Tトークンで学習

MPT-30B
-@MosaicMLのオープンソースで商用利用可能な最新モデル
-最大8000コンテキストの1Tトークンで学習
-InstructとChatが大幅に改善https://t.co/p8lMDXVJJ8 https://t.co/7yTwim1saM pic.twitter.com/ZaKBOi9Kwr
— 納村聡仁 / Osamura Akinori (@akinoriosamura) June 22, 2023

いいなと思ったら応援しよう！

この記事が参加している募集

#AIとやってみた

48,039件