見出し画像

基盤モデル(FM)

皆さんこんにちは
若者に色々役に立つ情報をたまに呟いているおじさんです。

最近耳にし始めた新しいキーワードで基盤モデル(Foundation Model)がありますが、元になって論文による定義では、「大量かつ多様なデータで訓練(学習)され、多様な下流タスクに対応(ファインチューニング)できるモデル」ということみたいです。Chat-GPTのような言語生成系AIや僕が良くサムネに使っているAdobe Fireflyのような生成系AIの基盤となるデータ蓄積型学習システムを指していて、元々は言語生成なら文章解析、画像生成ならオブジェクト認識というような1つの目的のためのAI学習データを基に自動生成を行っていたものが、画像も、文章も、音声も、すべてまとめて学習しトレーニングされた集合体を基盤モデルと定義しているようです。このFMを使うことで、画像生成を行いたい人は文章解析→必要な画像データの収集→画像の構築を行うことで画像生成AIのインタフェースを作ることができます。音声の認識→文章化→文章の解析→画像生成のような形も作ることができます。

https://arxiv.org/pdf/2108.07258

生成系AI(Generative AI)についてAWSが最近ホットなようです。このようなFMを構築するには大量のCPUパワーが必要になりますが、以前のようにパソコンをいっぱい買って作るとか、お化けコアのマシンを買って作るのではなく、クラウド上の仮想空間で構築しようというのが、AWSの推しのようです。実際FMを維持し、G-AIを稼働させるのに必要なリソースは分からないので、どこまでAWSが現実的なのかは分かりませんが、少なくとも以前のような、特定の企業だけが環境を作れるという時代から、クラウド上で気軽に構築できる時代に変わっていくのかもしれません。そして、現状ではFMはあくまでフロントエンドのサービス(G-AI)に紐づいて各社に分かれていますが、どこかの企業が自由に使えるFMをクラウドで提供し始めると恐らく状況がかなり一変すると思います。しかし同時に、このようなコア情報が1か所から提供されることにより、以前からささやかれるGoogle八分のように情報の意図的な操作がFM環境でも行えてしまうかもしれません。FMにより提供されるデータは恣意的な要素が無いことが前提で万人が利用できるFMが成立するので、もしどこかの企業や国が独占してしまったら何か恐ろしいことが起こりそうで仕方がありません。FMが定義された論文でも、FMはまだ始まったばかりで、これから様々な広がりを見せ、同時に様々な部門や機関や組織に影響を与え続けるため、それぞれが相互に緊密なコミュニケーションをとって乗り越えていく必要があると結んでいます。(割と読みやすい論文なので是非読んでみてください)

私たちはAI進化の始まりの段階にいるのかもしれません。これからどのように発展しどの様に人類に影響を与えていくのでしょうか。

今回のサムネはAdobe Fireflyの画像生成AIで作成しました「The mother of all AI technologies, called the Foundation Model」

この記事が気に入ったらサポートをしてみませんか?