
聞いてはいけないこと:年齢、収入、学習データ
最近、動画の生成AIが話題です。今日は動画の学習データの出どころが不明というお話をします。
動画生成AI
2023年12月にGoogleが鳴り物入りでマルチモーダルAI Geminiを発表しました。2024年はマルチモーダル(テキスト、画像、音声、動画など複数のモダリティを扱う)AIの年になると言われていました。
そのとおりになっています:
2023年2月 Sora (OpenAI)
2023年2月 Ginie (Google DeepMind)
著作権の問題があるので大量の動画をどうやって入手するかが話題です。OpenAIは利用可能な動画を利用、というわかったようなわからないような説明をして話題になりました。GoogleはYouTubeを持っているので容易です。
年齢、収入、学習データ
動画の学習データが何かということが詮索されています。OpenAIでは明確な回答はありませんでした。
「聞いてはいけないこと:女性の年齢、男性の収入、生成AI会社の学習データ」というジョークが言われるようになりました。
データソース
使ってはいけないデータを使っているとは限りません。競争戦略上、秘匿している可能性もあります。いずれにせよ、大量の高品質な動画データを入手するのは難しいです。Unreal Engineで物理シミュレーションをした動画を使っているだろうともいわれています(参考文献 Y-Combinator動画)。
むすび
やりかたがわかれば生成AIのモデル学習はお金をどれだけかけるかどうかでできるようになっています。xAIのGrok-1.5なども小さなチームで9ヶ月でリリースされています。
動画についてはまだデータソースのノウハウが明らかでないですが、明らかになれば、この分野もレッドオーシャンになっていくのかもしれません。
参考文献
OpenAI's STUNNING SORA Movies Showcase | Sam Altman Goes to Hollywood and Creativity Unchained https://www.youtube.com/watch?v=nKlb1ygfYxk Wes Roth 26m19s 2024年
How To Build Generative AI Models Like OpenAI's Sora https://www.youtube.com/watch?v=fmI_OciHV_8 Y-Combinator 34m05s 2024年
Elon Musk FINALLY Introduces GROK 1.5 - XAI Grok 1.5 MASSIVE UPDATE! https://www.youtube.com/watch?v=4Ot5HLKhyVw TheAIGRID 2024年 8m54s