【1/21-1/27】生成AIニュース/調達/研究-Weeklyまとめ
ニュース
・Microsoft、全製品にAIを搭載へ
・生成AIカオスマップ v2
https://base10.vc/post/generative-ai-mission-critical/
・chatgptが様々な難関試験で合格レベル
・米国医師免許試験
http://medrxiv.org/content/10.110...
・MBAレベルのオペレーション試験にて http://mackinstitute.wharton.upenn.edu/wp-content/upl...
・司法試験 (証拠法と不法行為法で平均合格率を超える) http://papers.ssrn.com/sol3/papers.cf...
・ChatGPT Professional Plan ($42/月)の様子(一部でのみ公開)
非常に高速
・ChatGPTなどAI、専門職の30%が活用
約4500人の専門職を対象にソーシャルプラットフォームのフィッシュボウルが今月実施した調査の結果
・OpenAIの競合で、汎用言語AIを作っているAnnthropicがプロンプトエンジニアの採用募集
給与 - 25 万ドルから 33 万 5,000 ドル https://jobs.lever.co/Anthropic/e3cde481-d446-460f-b576-93cab67bd1ed…
・Microsoft、OpenAIに複数年で100億ドルの投資を決定
・OpenAIとMicrosoftのパートナーシップに関する公式声明
Microsoft と提携して、API とAzure OpenAI サービスを通じてテクノロジを展開し、企業や開発者が GPT、DALL·E、および Codex の上に構築できるようにする。
・多くのスタンフォード大学生が最終試験で ChatGPT を使用したことが調査で示唆された
・ChatGPTで子どもの練習用に基礎単語1000単語くらい網羅した瞬間英作文教材を生成した例
・Googleを3年前に去った創業者ラリー・ペイジとセルゲイ・ブリンが再び招待される
・1 日のアクティブ ユーザー数が 1,000 万人に達するまでの日数
インスタグラム:355日
ChatGPT: 40日
・Nature の論文執筆のための言語モデル使用に関するポリシー
- 言語モデルは説明責任のないツールであり、共著者としてリストすることはできない。
- 言語モデルツールを使用する研究者は、方法または謝辞のセクションでこの使用を文書化する必要
・スタンフォード大学で4,497人の学生を調査したところ、17%が去年の秋の宿題や試験でChatGPTを活用したと回答。
その17%のうちほとんどはAIでアイデア出しなどを行い、5%はほぼ編集なくChatGPTの回答をそのまま提出した。 https://stanforddaily.com/2023/01/22/scores-of-stanford-students-used-chatgpt-on-final-exams-survey-suggests/
・ChatGPTを始めとするAIの使い方まとめ @keccak255さんより
リサーチ, 英語学習, スライド資料, 画像生成, 提案書の作成, UIデザイン, ハーバード大学のPython無料講義などを厳選して整理。
・Clean Diffusion 2.0 PoCをリリース @alfredplplさんより
Stable Diffusion のうち、VAEとU-Netという画像が関わる部分を全てパブリックドメインの画像だけで作りました。現状は海しか作れません。ですが、クリーンなモデルは作れることを本モデルにより世界で初めて実証しました。
https://huggingface.co/alfredplpl/clean-diffusion-2-0-poc
・AI弁護士を法廷に立たせようとしていたDoNotPayが訴訟を延期
「州弁護士会の検察官から脅迫を受けた後、実際の法廷にロボット弁護士を連れてくると、6 か月間刑務所に入れられる可能性が高い」by CEO
調達
・Atomic AI(3,500 万ドル)
AI 駆動型 RNA 創薬
・CloseFactor(1500万ドル)
さまざまなセールスデータソースにわたって洞察を提供するセールス オートメーションスタートアップ
・durable(200万ドル)
Webサイト生成ツール。画像とコピーを含むWeb サイト全体を30秒で生成するAI Webサイトビルダー。
研究
・RGB画像と深度情報で3D生成
論文: https://arxiv.org/abs/2301.08247
プロジェクト: https://mcc3d.github.io
・RecolorNeRF: 3D シーンの効率的なカラー編集
論文: https://arxiv.org/abs/2301.07958
プロジェクト: https://sites.google.com/view/recolornerf
・Nvidia が医療研究向けの生成AI モデルを発表
与えられたパラメーターに適合する合成タンパク質の設計例を迅速に作成し、開発をスピードアップ。このAIを用いた2つの仮特許を申請中
・vtoonify
高解像度ポートレート映像をコミックスタイルなどに変更などできる
・NVAS(新しい視点での音響合成)
入力動画と音声から映像内の任意の視点での音響生成を可能に
論文: https://arxiv.org/abs/2301.08730
プロジェクト: https://vision.cs.utexas.edu/projects/nvas/
・動的シーンの高速3D合成
論文: http://arxiv.org/abs/2301.09632
プロジェクト: http://caoang327.github.io/HexPlane/
・TransFusion
動画情報を認識し、過去の行動と物体の関係による状況の流れを理解する。
これにより、将来のアクションとオブジェクトの予測が可能。
論文: arxiv.org/abs/2301.09209
プロジェクト: https://eth-ait.github.io/transfusion-proj/
・無限3D都市生成
1(右下->左上): 鳥瞰図から任意のスケールの2Dマップを生成
2(左上->右上): 生成された2Dマップをocpreeに変換
3(右上->左下): テクスチャリングし、2D画像をレンダリング
https://hubert0527.github.io/infinicity/
・動画の中でAIを使って服の着せ替え
デモ: https://huggingface.co/spaces/timbrooks/instruct-pix2pix
reddit: https://www.reddit.com/r/StableDiffusion/comments/10jrafq/replacing_clothes_using_ai_in_video/
・医療患者に対するChatGPTの対応テスト
患者の質問に対するChatGPTの回答は、医療関係者とほとんど区別できなかった。リスクの低い健康に関する質問にはAIを信頼しているよう
論文:
・LAIONが現時点最高のオープンソースCLIPモデルをリリース
ImageNetでのゼロショット精度80.1%、MS COCOでのゼロショット画像検索74.9%を達成
https://laion.ai/blog/giant-openclip/…
https://huggingface.co/laion/CLIP-ViT-bigG-14-laion2B-39B-b160k…
・Microsoft Researchによる気象・気候のための初の柔軟で汎用性の高い基盤モデル「ClimaX」
数時間先から数日、数週間先まで、グローバルおよび地域的な予測。あるちは、様々な温室効果ガスのもとでの将来の気候を予測。
ブログ: http://microsoft.com/en-us/research...
Paper: http://arxiv.org/abs/2301.10343
・大規模な生物医学文献で事前に学習させたドメイン固有の生成モデルであるBioGPT
人間と同等の精度を達成し、他の一般的および科学的な言語モデルを上回り、科学的発見の様々なシナリオで生物学者を支援することができる。
詳細:
・Text to 4D: テキストから3D動画シーン生成
論文: http://arxiv.org/abs/2301.11280
プロジェクト: http://make-a-video3d.github.io
・MusicLM: テキストから音楽を生成
論文: http://arxiv.org/abs/2301.11325
プロジェクト: http://google-research.github.io/seanet/musiclm...