
【7/1-7/7】生成AI活用事例/研究開発-Weeklyまとめ
今週のAIに関する活用事例や研究開発の備忘録記事です。
活用事例
・生成AI x MV
是非フルで見て!
— 猩々 博士🧪学術系Vtuber & AITuber開発中 (@Mega_Gorilla_) July 3, 2023
生成AIフル活用 + ゴリラの労力で制作したMV!
映像は没になった、冒頭部分!!
映像は、3Dモデル+画像生成AI+編集
音声は、RVC+VOICEVOX
で制作されています。#AI #AIアート #AITuber #AIArtworks #AI美女 #AIgirl https://t.co/1xt09mqXxI
・パナソニックコネクト、3カ月での利用実績が想定の5倍超え
利用回数は想定の5倍超、ChatGPT全社導入から3カ月でのパナソニックコネクトの利用実績
-パナソニックコネクトは2月、Azure OpenAI Serviceを基に開発したConnectGPTを国内全社員を対象に提供開始
-現在はConnectGPTをConnectAIと改称して運用
・Microsoftとムーディーズが提携し、AIを利用した企業情報分析サービスを展開する計画
Microsoftとムーディーズ 生成AIで企業情報分析サービス -6月、信用格付け企業ムーディーズとMicrosoftは提携を発表 -保有する企業財務や信用リスクデータを利用し、要望に応じて企業情報をAIが生成、提供するサービスを展開する計画
・ByteDance、eコマース向けに物流ロボットを開発
ByteDanceさんもロボット業界に来た
-ByteDance、eコマース事業向けに物流ロボットを構築
-ロボット工学チームは現在約50人の従業員で構成されており、年内には数百人に拡大する計画
・BaiduがiOS向けの無料ERNIE Botアプリを発表
Baidu、iOS向け無料ERNIE Botアプリを発表
-ChatGPTのようなサービス「ERNIE Bot」の無料iOSアプリを発表
-招待コードを持っている人は自動的にモバイルアプリにアクセスでき、その他のユーザー希望者はアクセスを申請することができる
・令和最新版の対話型AIローカル支部のレポート
記事を投稿しました!
— saldra(サルドラ) (@sald_ra) July 4, 2023
令和最新版の対話型AIローカル支部のレポートです!
3月くらいからローカルAIに参入したので、そこからいままでの備忘録になっています。
peft,calm,rinna,ctranslate2の流れを汲んだ歴史書です。
読め!https://t.co/R36Rp3pFnY#qiita
・AI歌コンテスト2023、スペインで開催決定
AI歌コンテスト2023が復活し、11月4日にスペインのA Coruñaで開催
応募受付中
The AI Song Contest 2023 is back and it's coming to A Coruña on November 4💜.
— AI Song Contest (@aisongcontest) July 4, 2023
The Contest is open for submission NOW🥁. Visit https://t.co/bUxctSb9QV for the details! #aisongcontest #galicia #aimusic pic.twitter.com/erosJeV2jG
・DeepMindのDemis HassabisさんによるAIのクリエイティビティの進化
DeepMindのDemis HassabisさんによるAIの3つのレベルのクリエイティビティ。
— Tetsuro Miyatake (@tmiyatake1) July 5, 2023
・Interpolation:100万枚の猫の画像から新しい猫の画像を生成
・Extrapolation:AlphaGoは何回も対戦を繰り返して新しい戦略を思いつく
・True Invention:ゲーム自体を作る
まだ2番目のレベルだが、徐々に成長してる。 pic.twitter.com/KM6NnMCUoe
・ByteDanceの音楽配信アプリ「Resso」、2.5億ダウンロードを達成しSpotifyと競争開始
ByteDanceの音楽配信アプリ「Resso」は2023年5月時点で2.5億ダウンロードを達成、Spotifyと対抗するレベルになり始めた。
— Tetsuro Miyatake (@tmiyatake1) July 5, 2023
ただ直近では有料化すると判断したので、それによってどうエンゲージメント率が変わるのかは気になる。https://t.co/qPmLiYnBay pic.twitter.com/ruerYZXmpY
・ITmedia NEWS、AIを導入して記事執筆フローを改善
ITmedia NEWSは記事執筆フローにChatGPTなどAIを導入しますhttps://t.co/g79bzqEezs
— ITmedia NEWS (@itmedia_news) July 5, 2023
・ゲームのテストプレイを自動化するツール『Playable!』がリリース
ゲームのテストプレイをAIで自動化するツール『Playable!』リリース。自然言語で指示するだけでテストプレイしてくれる機能も年内に実装予定https://t.co/I7vUA7LuKY
— ゲームメーカーズ (@GameMakersJP) July 5, 2023
無料トライアルも提供開始。コリジョン抜けチェックや通しプレイ、マップのアイテムまでの経路チェックを自動化する pic.twitter.com/CjUnMs7j85
・西武新宿駅、同時翻訳新システムを導入し、インバウンド対応を広げる
西武新宿駅 同時翻訳新システム導入へ インバウンド対応広がるhttps://t.co/yBVZya7Dqo#nhk_video pic.twitter.com/hSEdwu9FbP
— NHKニュース (@nhk_news) July 5, 2023
・デジタルヒューマン開発企業Deemosが東アジア人顔を活かし、日本進出を拡大
【日本進出特集】超高精度を誇るデジタルヒューマン開発の「Deemos」、「東アジア人顔」を強みに拡大 https://t.co/mz5vGal45z
— 36Kr Japan@中国テック・スタートアップ専門メディア (@36krJ) July 6, 2023
・KokoMind
Put ChatGPT at a cocktail party🥂.
— Weiyan Shi (@shi_weiyan) July 5, 2023
Can it
- understand people's conversations, gestures
- figure out their relations,
- and even chime in with social advice?
🦍Announce KokoMind.
🌟Check out this demo! More at https://t.co/giyU7cyg3D #AI #GPT4 #ChatGPT #OpenAI #Shrinking 🧵 pic.twitter.com/h6BOBDtL4F
・元Twitterの経営メンバーと元GiphyのCTOがAIパーソナルアシスタント「Lighty AI」をローンチ
元Twitterの経営メンバーの2人と元GiphyのCTOがAIパーソナルアシスタント「Lighty AI」をローンチ。
— Tetsuro Miyatake (@tmiyatake1) July 6, 2023
今はGmailやSlackで行われた会話から自動的にMTGをスケジュールしてくれるが、今後はMTGアジェンダやサマリーなどを生成できるようになる。https://t.co/d5FWkZ8HSe
・米軍、情報取得の効率化
米軍もLLMを活用し始めている。
— Tetsuro Miyatake (@tmiyatake1) July 6, 2023
あまりデジタル化されていないアメリカ軍は情報を取得するリクエストを出すとスタッフが電話などを通して数時間から数日かかるのを、10分以内で届くようになった。https://t.co/luKQEjHSDs
・Google、ウェブ上のスクレーピングデータを活用
GoogleはBardのトレーニングでウェブ上でスクレーピングしたデータも活用している。https://t.co/ZSGAPkHd5L
— Tetsuro Miyatake (@tmiyatake1) July 6, 2023
・NTTデータ、生成AIサービスを提供開始
NTTデータ、生成AIサービスを提供開始。社内ファイル等と連携し根拠ある回答文を作成
— AIポータルメディア「AIsmiley」 (@AIsmiley_inc) July 6, 2023
NTTデータは、多様な社内データを生成AIとセキュアに連携させて回答文を作成する生成AIサービスの提供を開始しました。https://t.co/mgk1iVJhUg
・Runway Gen-2を使用して日本の観光PRビデオを試作
日本の観光PRビデオをイメージした動画をRunway Gen-2で試作。プロンプトのテストから数時間で作ったと思えば結構悪くない…?あまり厳密性が求められる絵作りはできないけど。
— KAORU NAITO (@ka0ru_1620) July 5, 2023
コピー:ChatGPT
動画生成:Runway Gen-2/Text to video
ナレーション:Eleven Labs
音楽/テキストアニメ:Renderforest pic.twitter.com/FesKSHdxwW
・中国ByteDanceが顔写真から見えない後頭部を再構築する技術を開発
正面の顔写真1枚から“見えない後頭部”をいい感じに3Dで生成 中国ByteDanceなどが技術開発 https://t.co/USNy605KRH 肖像画の写真1枚のみから見えない後頭部を含めた360度の3D頭部モデルを再構築する「PanoHead」。 pic.twitter.com/fkiJKq1V9t
— Seamless (@shiropen2) July 6, 2023
・AWSが日本企業のAI開発を支援、600万ドルの負担を負う
AWS 日本企業の生成AI開発支援、総額600万ドル規模のコスト負担へ
-計算機リソースの確保に関するガイダンス、AWS上でのLLM事前学習に関わる技術的なメンタリング、LLM事前学習用クレジット、ビジネス支援などを提供
・NEC、7月より企業向けに独自開発の生成AIを提供開始
NECが、独自開発した生成AIを7月より企業向けに提供開始
-日本国内のデータセンターを活用し、機密性や重要性の高い情報の管理が可能
-文章の生成などを自動で行う
・ABEJA、大規模言語モデル「ABEJA LLM Series」のサポートを拡大ABEJA、大規模言語モデル「ABEJA LLM Series」のサポートを拡大
-「ABEJA LLM Series」の戦略策定やBPRなど周辺領域のサポートを拡大
-LLM導入の課題をサポートし、基幹業務におけるLLMの実装を加速
研究開発
・中国企業が医療用大規模言語モデル「MedGPT」を発表
医療用大規模言語モデル「MedGPT」、中国企業が発表 問診・検査から正確な診断導く
-医者によるフィードバック学習
-さまざまな医療検査を統合してつくりあげたマルチモダリティ
-問診、検査、治療計画作成、服薬指導と管理、定期診察・再診、リハビリ指導など
・Open Orca: GPT-4による推論をオープンモデルにもたらすプロジェクトとデータセットを公開しました
We released Open Orca, the project and dataset that brings GPT-4 reasoning to open models yesterday. https://t.co/M9tsZPfk08
— Alignment Lab AI (@alignment_lab) July 1, 2023
This dataset aims to reproduce the stunning results from Microsoft Research's Orca paper showing a small model besting ChatGPT in hard reasoning.
🧵 1..
・AI企業のCohereのCEO、合成データの未来に期待
最近LLMのトレーニングデータでAIが生成した合成データを使うのがモデルには悪影響を与えるという研究もあったが、AI企業のCohereのCEOは合成データが未来だと信じている。
— Tetsuro Miyatake (@tmiyatake1) July 3, 2023
この問題を解決出来るとめちゃくちゃ大きな市場と可能性が生まれてくる。https://t.co/n22wSn0xKF
・InstructBLIPがリリース
視覚言語モデルBLIP-2 x 視覚言語命令チューニング
InstructBLIP by @salesforce is now available @huggingface !
— Niels Rogge (@NielsRogge) July 3, 2023
A vision-language instruction tuned version of BLIP-2, making it possible to chat about images as shown below 🤗
Have fun playing with it!https://t.co/wKqbPdw5ap pic.twitter.com/kbipea0JKB
・生成AIウィークリー:重要論文のまとめ
「毎日がゲームチェンジャー」の生成AI時代を生き抜くために、1週間分の重要論文をまとめました(新連載・生成AIウィークリー) | テクノエッジ TechnoEdgehttps://t.co/LWLoTRNTEB
— テクノエッジ TechnoEdge (@TechnoEdgeJP) July 3, 2023
・「ARIES」データセットが論文査読&改善プロセスを分析
約50万件の論文査読データセット「ARIES」が公開、論文の査読&改善プロセスを分析https://t.co/QjvdYVVc1D
— AIDB (@ai_database) July 3, 2023
MITなどの研究者グループが開発した「ARIES」は、約14万件の論文とそれに対する約50万件の査読内容からなる大規模データセットです。論文の査読と改善の過程を詳細に分析することを可能に。
・LLMを使用したQAにおける課題と対策
Langchainとかで、RetrievalしてLLMでQAとか(いわゆるRAG)するの実際結構課題あるよねとかこんな対策もあるよね的な記事書きました!https://t.co/y9m6O27Cqx
— pao (@pppaaaooo) July 3, 2023
・実世界での人間舞踊生成のための分離制御技術
DisCo: 実世界における人間舞踊生成のための分離制御
特定の人にさまざまなダンスを踊らせたり、特定のダンスをさまざまな人に反映させたりと
PJ: https://disco-dance.github.io
論文: https://huggingface.co/papers/2307.00040…
github: https://github.com/Wangt-CN/DisCo
デモ(なぜか開かない): https://d383ecc864f168ffb5.gradio.live
DisCo: Disentangled Control for Referring Human Dance Generation in Real World
— AK (@_akhaliq) July 4, 2023
paper page: https://t.co/bL1fWJCLcs
Generative AI has made significant strides in computer vision, particularly in image/video synthesis conditioned on text descriptions. Despite the advancements, it… pic.twitter.com/qmZYkzyx4U
・NICTが日本語に特化した大規模言語モデルを試作、現在も学習中
日本語に特化した大規模言語モデル(生成AI)を試作https://t.co/5lLW66SHBf
— 小猫遊りょう(たかにゃし・りょう) (@jaguring1) July 4, 2023
「400億パラメータの大規模言語モデル(生成AI)を350 GBの日本語テキストを用いて開発」
「従来から利用していた高品質な日本語テキストを事前学習することで、約4か月で開発」
「現在1,790億パラメータのモデルも学習中」
・高品質な日本語CoTデータセットが作成
https://t.co/AuUFhrKjnb
— すでぃー@AITuber開発中 (@sudy_super) July 4, 2023
人手で作成された高品質で100セットの完全クリーンな日本語CoT用データセットを作りました!
イメージで言うとopen-orcaの日本語かつライセンスフリー版です!
・マルチモーダルLLMに関するサーベイ:データ構築、モーダル間接続、学習、評価方法のまとめ
マルチモーダルLLM(特に画像)についてのサーベイ。データ構築、モーダル間接続方法、学習方法、評価方法がまとまっている。LLMはタスク指示、結果取得のインターフェース以外にタスクの制御(タスク分解、ツール選定)、判断、言語由来知識による改善などで使える。https://t.co/xxel4aMRaN
— Daisuke Okanohara / 岡野原 大輔 (@hillbig) July 4, 2023
・AdaLoRA: ランク割り当てに特異値ベースのアダプティブ手法を使用したLoRAの上位互換
LoRA の上位互換っぽい手法 各差分行列に割り当てるランクを特異値ベースで Adaptive に決めていくので「AdaLoRA」https://t.co/IEheXSVLmX (ICLR2023)
— たかやま (@tkym1220) July 4, 2023
PEFT に実装済みhttps://t.co/NWC3Zp1ffN
・LLMのFine-Tuning手法のまとめ
LLMのFine-Tuning手法まとめ https://t.co/hFwjE5z8dZ #Qiita
— Sakusakumura (@Sakkusakumura) July 4, 2023
・McKinseyによる生成AIの経済的可能性のレポート
McKinseyによる、生成AIの経済的可能性:次の生産性フロンティアに関するレポート
Machines have bestowed us with incredible "superpowers," transforming our abilities in both physical and cognitive realms.
— McKinsey & Company (@McKinsey) July 4, 2023
The impact of #generativeAI on different activities and occupations will likely differ from older #technologies. Learn more➡ https://t.co/aueTuIsdDw pic.twitter.com/FIFaBKgjq9
・Hugging Faceの推論エンドポイントを使用してLLMをデプロイする方法huggingface推論エンドポイントを使ってLLMをデプロイする方法
Open-source LLMs like Falcon, (Open-)LLaMA, X-Gen, or StarCoder, come a long way and can compete with models like GPT4 on certain use cases. 🥊
— Philipp Schmid (@_philschmid) July 4, 2023
I'm excited to share a new blog on how to deply LLMs using @huggingface Inference Endpoints.
👉 https://t.co/6NQ8q24cJs
🧵 1/3
・多言語E5の大きなモデルが日本語で公開
何日か前に、多言語E5の大きなモデルが公開されていたので、日本語で試してみた。https://t.co/kUBsJiRPiB
— Hironsan (@Hironsan13) July 4, 2023
・ StabilityAIの研究チームによるSDXL技術レポートが近日中にarXivに掲載予定
The #SDXL technical report from the @StabilityAI research and applied team
— Emad (@EMostaque) July 4, 2023
Should be in arxiv soonhttps://t.co/zajywXnmPV pic.twitter.com/dv8NTgVeuf
・Inflection AIが8億8000万ドルのAIスーパーコンピューターを開発
話題のWonderStudioでフルCGアニメーションは作れるのかを検証してみたw
— ダストマン (@dustman_tips) July 4, 2023
ちなみにプロ版で試した!
結論から言うとマジでゲームチェンジャーなのでは…?
シンプルに実写素材の人物をCGモデルに差し替えるだけなら十分すぎるほどの性能を叩き出してくれた。… pic.twitter.com/50Z3prFbww
・Hyenaの新しいモデルが登場
Hyena(S4やH3と同じ状態空間モデルの系譜)のコンテキスト長 1k~1Mのモデルが出たらしい!!
— はまなすなぎさ (@RosaRugosaBeach) July 5, 2023
今はなぜか遺伝子コードで事前学習したモデルが公開されてるけど、モデルだけ転用してどこかお金持ってるとこがLLMにしてくれることを期待(実装が出てきたことに価値がある)https://t.co/1v0kUDNJZ7
・Midjourneyの進捗状況の比較
Midjourney
— Nick St. Pierre (@nickfloats) July 4, 2023
July 2022: July 2023: pic.twitter.com/6PBJCoXJu6
・Open AI、超知能のアライメント問題解決のために計画発表
Open AIが今後4年以内に超知能のアライメント問題を解決するために、恐らく前代未聞のレベルの計算資源(Open AI保有計算資源の20%)をわりあて、Ilya Sutskever氏と Jan Leike氏をリーダーとする新たなチームを結成。
— bioshok(INFJ) (@bioshok3) July 5, 2023
10年以内の超知能実現による人類への壊滅的なリスクを抑える積極的な計画発表。 https://t.co/VQCgGK9OoZ
・Inflection AIが8億8000万ドルのAIスーパーコンピューターを開発Inflection-1モデルを開発しているInflection AIが、8億8000万ドルのAIスーパーコンピューターを開発
-22,000個のH100 GPUが搭載
-先日、Nvidiaなどから13億ドルを調達
https://wccftech.com/inflection-ai-develops-supercomputer-equipped-with-22000-nvidia-h100-ai-gpus/…
Inflection AI just created a $880,000,000 AI supercomputer.
— Rowan Cheung (@rowancheung) July 5, 2023
The supercomputer is equipped with 22,000 NVIDIA H100 AI GPUs (currently worth ~$40,000 each).
Details:
-Inflection AI has raised $1.5 billion ($4 billion valuation) and anticipates that its new supercomputer will… pic.twitter.com/44JAVtB7dr
・北京大学がオープンソースの法律モデル「ChatLaw」をリリース
北京大学の研究チームは、法律知識に特化したオープンソースの大規模モデル「ChatLaw」をリリース
-現在のところ、専門的な法律コンサルティング機能は含まれていない
・LongNet: Transformerを10億トークンに拡張
LongNet: Transformerを10億トークンに拡張
-短いシーケンスの性能を犠牲にすることなく、10億トークン以上に拡張できるTransformer
論文: https://arxiv.org/abs/2307.02486
github: https://github.com/microsoft/torchscale…
LongNet: Scaling Transformers to 1,000,000,000 Tokens
— Aran Komatsuzaki (@arankomatsuzaki) July 6, 2023
Presents LONGNET, a Transformer variant that can scale sequence length to more than 1 billion tokens, without sacrificing the performance on shorter sequences
abs: https://t.co/5rf4tcVDuk
repo: https://t.co/xVT0MhZNN0 pic.twitter.com/uJJkjIqKNA
・松尾氏が東大でAIシンポジウムに登壇
7月4日開催「東大×生成AIシンポジウム」に松尾が登壇し、アーカイブ動画が公開されました。https://t.co/XQmrmYH49X
— 東京大学 松尾研究室 (@Matsuo_Lab) July 6, 2023
・会社で13Bの日本語モデルを作成した経験
ようやく話せるようになった!
— K. Akimoto (@kosuke1701) July 6, 2023
実はここ最近は会社で13Bの日本語モデル作ってました。実際作ってみるとやってみて初めてわかるノウハウの塊で大変でしたね…。AI王以来再び胃袋を痛めました。https://t.co/t1tzfpxDyB
・NECの130億パラメータ日本語LLMとChatGPTの回答比較
NECの130億パラメータ日本語LLMの性能を確かめるために、ChatGPTに同じ質問を投げて回答を比較してみました。 https://t.co/wldLeAXpwK pic.twitter.com/x6ApF4b2Jm
— IT navi (@itnavi2022) July 6, 2023
・エヌビディア、AI開発向け半導体GPUを2240基調達
“エヌビディアからAI開発に適した半導体GPU(画像処理半導体)を2240基調達するとしていて”https://t.co/KCzUwsnL4t
— カモシカ-LoRA🤗 (@kam0shika) July 6, 2023
・新たな次元削減手法"Deep TDA"が登場し、高い性能を示す
新たな次元削減手法"Deep TDA"なるものが紹介されている。
— Daichi Konno / 紺野 大地 (@_daichikonno) July 6, 2023
多くのケースでt-SNEやUMAPを上回る性能を示すとのこと。
神経科学において次元削減や可視化は極めて重要であり、多くの洞察を得ることができる。
既にPython用のライブラリも用意されており、ぜひ使ってみたいです! https://t.co/HVw0ltHohM
・LLM調査のリポジトリが公開
LLM Survey
https://github.com/RUCAIBox/LLMSurvey…
🔥 Major Updates on the LLM Survey 🔥
— Yupeng Hou (@yupenghou97) July 5, 2023
* 34+ new pages, 200+ new references
* New figures (e.g. 🦙LLaMA family)
* New chapters (e.g. complex task planning w/ LLMs)
* 26 useful prompting tips
* Empirical evaluation of 8 abilities of LLMs with specially selected tasks
1/n 🧵 pic.twitter.com/NjFoY39zUw
・松尾研の学部生がLLMベースのロボットシステムで高精度な物体認識を実現し、ロボコンで賞を総なめ
松尾研の学部生がロボコンでLLMベースのロボットシステムを作って賞総なめしたらしい
— Gaku_Noguchi (@noggaku3) July 4, 2023
事前に学習していない物体も高い精度で認識できるとのこと。横で人が声に出して補足した情報が、whisper通じて物体認識の精度が上がる。これはおもしろいhttps://t.co/EBBy4C5sbC pic.twitter.com/bXXnuzx584
・GPT-4のAPIが公開
GPT-4 API is now available to all paying OpenAI API customers. GPT-3.5 Turbo, DALL·E, and Whisper APIs are also now generally available, and we’re announcing a deprecation plan for some of our older models, which will retire beginning of 2024: https://t.co/H11w4IalNZ
— OpenAI (@OpenAI) July 6, 2023
・言語モデルの文脈利用における制約とは
Lost in the Middle言語モデルは長い文脈をどのように使うか
-関連情報が入力文脈の先頭か末尾にある場合に最も高く、そうでない場合は低下
-途中で関連情報にアクセスする必要がある場合低下
-入力が長くなるにつれて低下
https://arxiv.org/abs/2307.03172
Lost in the Middle: How Language Models Use Long Contexts
— Aran Komatsuzaki (@arankomatsuzaki) July 7, 2023
Finds that performance of LMs is often highest when relevant info occurs at the beginning or end of the input context, and significantly degrades otherwisehttps://t.co/QdYW93W2d1 pic.twitter.com/rVkq90SQx4