【2/25-3/3】生成AI調達/ニュース-Weeklyまとめ
今週のAIに関する調達やニュース情報をまとめた記事です。
調達
・OpenAIのアプリレイヤーへの投資
・Y combinator Winter23に生成AIの企業が結構あったので(43社/211社)、一覧シートをBrowse AIやGPT3を使い作成してみた。
2022年だとSummerとWinter合計で12社/628社だったからかなり増えてる。 ▼YC W23
生成AI企業一覧note https://note.com/mitsuya2635/n/nf30d1462994e…
▼参考yconサイト https://ycombinator.com/companies?batch=W23&tags=Generative%20AI
・音声AIスタートアップのVoicemodが1,450 万ドル調達
音声変換や歌声変換、歌詞から歌声生成などを展開している。
・契約の起草と編集を支援することで、企業の弁護士費用を最大 75% 削減するRobinAIが、1050万ドル調達
・マーケティング コピーと画像生成ツールのTypeface が 6,500 万ドル調達
指示文を入力すると、画像付きの文章を生成。画像やコピーのトーンは、カスタマイズできる。
https://tcrn.ch/3y0cuOE
・生成AI周辺のVCの動き
https://www.newcomer.co/p/marc-andreessen-joining-characterai?utm_medium=email
・Versed
AIによってフル3Dで生成された自分だけのRPGを誰でも作れるようにしようとしている。 資金を調達もしてるらしい。
・声に特化した「ジェネレーティブAI」Voicemodが1,450万ドル調達
ニュース
・ByteDance は、大規模な言語モデルチームを設立し、その技術を検索および広告ビジネスに組み込むことを目指している。
言語と画像処理に焦点を当て、今年半ばに発売される予定
・リアルタイムで顔画像変換をやられている方の実験
・Kindle ストアで、「ChatGPT を使用したコンテンツの書き方と作成方法」、「宿題の力」など日々増加
ChatGPT によって完全に書かれた、ChatGPT の使用に関する本という新しいサブジャンルさえある
https://www.reuters.com/technology/chatgpt-launches-boom-ai-written-e-books-amazon-2023-02-21/
・OpenAI CEOによる「Planning for AGI and beyond」
短期的には、①展開し触れてもらい改善する②コントロール可能にする③システムの管理/利益分配/公平なアクセスに関して対話する、のが重要。長期的には、人類の未来は人類によって決定されるべきで、情報を共有することが重要と信じている
・自分のチャットのRLHF
RLHFにより言語モデルを学習できるtrlXを使い、ユーザーが @AnthropicAIの Helpful & Harmless データセットを使用して、 自分のアシスタントを RLHF する方法の紹介
・video loop backとcontrolnet with Cannyによる動画
・ソニーG・北野CTO「大規模AIモデル、自社で開発」
大規模なAIモデルを開発する『ソニー リサーチ』は(言語や画像の大規模なデータを使って訓練する)『基盤(ファンデーション)モデル』の開発に取り組む。今後はこうした大規模モデルを何らか持つことが必須になる。 https://nikkei.com/article/DGXZQOUC095BT0Z01C22A2000000/
・Marc AndreessenとSteven Sinofskyが語るAI
・マイクロソフトから独立し、りんなのコア技術を提供しているシャオアイスが、AIチャットボット「X-CoTA」を内部テスト
ひたすら大きいモデルではなく、企業が必要とする能力を発揮できるぐらいの大きさで低コスト展開を目指す。
・scale AIのプロンプトエンジニアとの話
約 700 人のプロンプトエンジニアが PromptBase でプロンプトを販売していたり、小児病院が医療データを分析支援するAI プロンプト エンジニアの採用をしたり、法律事務所がリーガルプロンプトエンジニアを募集したりと、プロンプト周りの話が色々書かれてる
https://www.washingtonpost.com/technology/2023/02/25/prompt-engineers-techs-next-big-job/
・ロボットがトイレ掃除
・Stable Diffusion、Houdini、Multi-ControlNetを使ってアイソメトリック風景画像を作成している事例 https://reddit.com/r/StableDiffusion/comments/11bkjyo/multicontrolnet_is_a_great_tool_for_creating/
・VFXスタジオ「Corridor Digital」がStable Diffusionを使って実写からアニメーションに変換するなどのプロセスを経てハイクオリティな映像「ANIME ROCK, PAPER, SCISSORS」を制作
制作プロセス: https://youtube.com/watch?v=_9LX9HSQkWo…
本編: https://youtube.com/watch?v=GVT3WUa-48Y…
・ControlNetとEbsynthを使った実験
・AIで生成されたキャラクターから、この映画のような3Dアニメーションを作る方法
・Notion AIで、以前noteに書いた「AIと一緒にデザインする実験」
・AIで好きなポーズを出すために、モデルを10万枚撮影して手動でタグ付けしてみた
・Anthropic が一部のスタートアップ企業にテキスト生成モデルの提供を開始
Anthropic モデルの統合を発表した最初の企業は、法務テックスタートアップのRobin AI。QuoraのチャットボットPoe は、Anthropic モデルを使用していますが、現在は収益化されていない。
・バイドゥの“中国版ChatGPT”、リリース前でも300社が協業表明。政府後押しで市場の強気続く
・Mark Zuckerberg は、Meta には現在、AI ツールと「persona」を構築するチームがあると述べている
・@PartnershipAIが、生成コンテンツを責任を持って開発、作成、および共有する方法に関するフレームワークを発表 パートナーにadobeやtiktok, openaiも
@PartnershipAIは、 AI の将来に関する最も重要で困難な問題に取り組む、学術、市民社会、業界、およびメディア組織の非営利コミュニティ
・翼を羽ばたかせて枝に着地する鳥型ロボット「オーニソプター」
natureにも https://nature.com/articles/s41467-022-35356-5
・ChatGPTで、ファンタジーTRPGを遊ぶためのプロンプト
・DiscordでRunwayが「Gen-1」モデルのアーリーアクセスを正式に開始
「Gen-1」は言語と画像を使用して、既存の動画から新しい動画を生成できるAIモデル
詳細: https://research.runwayml.com/gen1
Discord: http://discord.gg/vzcy6cKrcE
・AITuberに興味のある人向けのチャンネルがdiscord公開
・OpenAIを設立し今は離れたイーロン・マスクがChatGPT に代わるものを開発するための新しい研究所を設立することを目論んでるとのこと
DeepMind AI 部門を離れたIgor Babuschkin を採用しているとか
・Metaが独自のAIチャットボットの開発にリソースを集中することが明らかに
・ネイバーがチャットGPTに比べて韓国語を6500倍多く学習した「ハイパークローバーX」をリリース
非英語圏に特化した超大規模AI環境を構築する計画。AIチャットボットを搭載した検索サービス「サーチGPT」も今年上半期中に発売する予定
・コミュニティ運営のAI生成モデル
フォロワー1.4万人
https://instagram.com/heyitsailice/
・ミッドジャーニーが生殖器官の入力を禁止
・新しい Bing を Windows 11 に導入し、iOS 用の Phone Link を導入
https://techcrunch.com/2023/02/28/microsoft-brings-the-new-bing-to-windows-11-and-launches-phone-link-for-ios/
・SlashNextは、生成AIを使用してフィッシング メールを99.9%検出するGenerative HumanAI を発表
フィッシング戦術を分析し、何千もの電子メールを生成し、これらを使い検出。具体的には、受信トレイをスキャンし、AI生成されたフィッシングメールのDBを参照して検出する。
・a16zによる「AI 時代の学習の未来に関する 5 つの予測」
https://a16z.com/2023/02/08/the-future-of-learning-education-knowledge-in-the-age-of-ai/
・網羅的にまとまった、拡散モデルの基礎、一般層への浸透、浮き彫りとなった問題点、および加速度的に発展する手法群
・SkebのAIに対するスタンスとAI生成データに対する規制について
・ChatGPTのAPIがついに!
-モデル : gpt-3.5-turbo(=ChatGPT)
-価格 : 1,000 トークンあたり 0.002 ドル 既存の GPT-3.5 モデルよりも 10 倍安く
-モデルの更新 : 本日 6 月 1 日までサポートされるgpt-3.5-turbo-0301をリリースし、4 月に 安定版gpt-3.5-turbo をリリース予定
・whisperAPIもアップデート!
Large-v2 モデルが API を通じて whisper-1 として利用可能になり、最速に。 料金 0.006 USD/分
・Instacart とShopifyがChatGPT AI APIを利用した新製品機能を発表
Instacart ChatGPTにレシピの提案や食事の計画を受け、材料がオンライン ショッピングカートに自動追加されるように Shopify ChatGPTからパーソナライズされたショッピング体験を受けれる
・Shopifyアプリで、ChatGPTがAI店員として機能してる
これがもし効果的ならどのECも導入が進む可能性 導入代行やEC構築サービスの機能として出てきそう
・テスラ社が初めてFSDベータ版の衝突データを公開
FSDベータを使用したテスラは320万マイル走行につき1回しか衝突しておらず、一方、米国の平均的なドライバーは500km走行につき1回衝突。FSDベータは5倍以上の安全性があると主張。
・ロボットが別のロボットの腕を付け直しているデモ
Teslaのインベスターデイで公開されていた新しいヒューマノイド ロボットOptimusの動画 電気自動車と同じ技術を使用して構築されているとのこと。
・イーロンマスクによるテスラのマスタープラン3が発表
テスラのパーパスは、持続可能なエネルギーへの世界の移行を加速すること
動画 https://twitter.com/verge/status/1631066920731521026
・Notion AI使い方Tips
Notion内に記載した内容を変数として扱える
・Youtubeで、今後数か月以内に生成AIをクリエイターが利用できるようになると発表
クリエイターの衣装や場所をバーチャルに入れ替えることができるAIツールとのこと。
・アバターが話す動画を生成できるD-IDが、会話できるデジタルヒューマンを展開
これまでのアバター生成技術と新しいチャットAPIの合わせ技
・Runway StudiosによるAIで生成されたショートフィルム
Ricardo Villavicencio と Runway Studios により作成。ここからさらにどんな映画などの作品が生まれるのか楽しみ http://studios.runwayml.com/#section-films
・GPT-3以降、大規模言語モデルの世界で何が起こっているのかを知れるスタンフォードの講義
video: https://youtu.be/-lnHHWRCDGk
スライド: https://docs.google.com/presentation/d/1WPYaLEEVJJI_-DOzjudeVoYpl_y0yUi1kWs0VFBnba4/edit?usp=drivesdk
・世界初の商業的に実行可能な自律型ヒューマノイドロボットを構築する AI ロボティクス企業Figure
- 完全電気機械式
-人間と一緒に安全に動作するよう設計
-人間ができる仕事ができる
-環境で考え、学び、相互作用する
-製造、物流、などの労働力不足の業界を対象とした、労働力への初期展開用に設計
https://twitter.com/Figure_robot/status/1631303034092519425
・3D生成関連情報が網羅されている記事
3D モデルとシーン生成に関する論文ガイド(Feb 2023) by @pinar_demirdag
・ScaleAIによるGPT-3.5 Turbo検証
言語モデルアプリを簡単に構築、比較、展開できるSpellbookを使い、分類/テキスト生成/数学のタスクでDavinci-003と比較 ほとんどのタスクで1/10のコストで Davinci-003 よりも優れたパフォーマンスを発揮
https://scale.com/blog/chatgpt-vs-davinci
・ChatGPTのデータサイエンスチートシート https://kdnuggets.com/2023/03/chatgpt-data-science-cheat-sheet.html
・PictoriaがAITuber事務所 AI CASTを設立
▼詳細はこちら