オープンソース AI モデル、 過去 3 年の人気トレンド
Haggingface で公開されてるオープンソース AI モデルの 2022 年からの推移が面白いのでまとめてみました。
他にもオープンソース AI モデルはたくさんあると思いますが、ここでは Haggingface で公開されてる "Most liked and downloaded models, from 2022 to today”(オープンソース AI モデル 2022 年からの推移)について考察します。
2022年: 画像生成モデルが圧倒的に人気
画像生成モデルが圧倒的に人気でした。特に「stable-diffusion-v1-4」やそのバリエーションが非常に多く、いいね数も群を抜いていました。
Midjourney のオープンソース版である、openjourney が、Stable Diffusion に次いでました。
まだ自然言語処理のオープンソースモデルも存在しますが、画像生成モデルに比べると数は少ない印象です。
2023年: 自然言語処理のオープン(ソース)モデルの人気が急上昇
自然言語処理のオープン(ソース)モデルの人気が急上昇しました。特に「Mistral」や「Llama」といったモデルが注目を集めていました。
Mistral とは、日本ではあまり聞かないかもしれませんが、欧米では大変人気のあるモデルです。フランスの AI スタートアップ、Mistral AI によって開発されていました。
Llama は、Meta が開発している日本でも人気があるモデルです。
画像生成モデルも依然として人気ですが、2022 年ほどの圧倒的な人気とはなくなりました。「ControlNet」のように、画像生成をより細かく制御できるモデルが人気を集めていました。
2024年: 小型で高性能な自然言語処理モデルが人気に
小型で高性能な自然言語処理モデルが人気になっています。「Meta Llama 3」や「Gemma」、「Phi-3」といった、よりコンパクトなモデルが上位にランクインしています。
Gemma は Google が開発するモデルです。オープンで軽量にもかかわらず、パフォーマンスが良いことで話題になっています。Googel AI Studio、Vertex AI や Haggingface で試すことができます。また、日本語テキストでファインチューニングされた Gemma 2 JPN というモデルもあります。Gemma 2 で英語のみのクエリを実行した場合と同程度のパフォーマンスで日本語をサポートします。
ここにはまだ載っていないですが、2024 年 12 月 26 日、DeepSeek から「DeepSeek V3」がリリースされました。671B パラメター数を持つ超大規模モデルで、非常に高いパフォーマンスをもちます。
画像生成モデルでは、FLUX の人気が高まってきてるようです。FLUX は、Stable Diffusion の共同開発者たちによって設立されたスタートアップ企業「Black Forest Labs(BFL)」が開発しているモデルです。複雑な画像を求めた際に、高いコンテキスト忠実性を持っているようです。
まとめと今後
オープン(ソース)モデルは、2022 年は画像生成モデルが中心でしたが、2023 年以降は自然言語処理モデル、そして、2024 年は、小型で高性能なモデルの人気が著しく高まっています。
今後はより小型で特定のタスクに特化した、高精度なモデルの開発も加速されるでしょう 。例えば、各国の言語、カルチャー、医療診断、法律文書の分析、金融取引の予測、セキュリティなど、専門性の高い分野で活躍する AI モデルが登場すると考えられます。