見出し画像

オープンソースが描くAI新時代:Synapticが語る、イノベーションを加速するOSSの力

代替データサービスベンダーのSynapticが紹介するAIのオープンソースソフトウェア(OSS)は、技術革新の最前線に立っています。GitHubやHugging Faceのようなプラットフォームのおかげで、世界中からアクセス可能な学術研究が広がり、大手技術企業が注ぎ込む莫大な資金、コンピューティングパワー、データにもかかわらず、OSSのプロジェクトはその成長と性能で驚異的な速度を示しています。この記事では、Synapticが提供する洞察を深掘りしていきます。

Synapticレポート:


オープンソースAIの現状

  • オープンソースAIは、新世代AIのイノベーションを加速させています。GitHubでの開発者貢献は2023年に前年比148%増加し、過去2年間でオープンソースAIに80億ドル以上が投資されました。特に注目すべきは、オープンソースモデルのMistral、Llamaがいくつかの閉鎖型モデルを上回るパフォーマンスを達成している点です。

OSSの主要構成要素

  • 基礎モデル:Llama、Mistralなど

  • 開発者ツール&フレームワーク:Langchain、Fixieなど

  • モデルトレーニングプラットフォーム:Weights & Biases、Anyscaleなど

  • モニタリングツール:Datadog、Seldonなど

グローバルな動き

  • 多様化する貢献者: オープンソースGen AIプロジェクトへの貢献は、米国とヨーロッパ以外からも増加しています。2023年はインドと日本が最多の貢献者数を記録し、2027年にはインドが米国を超えて最大の開発者コミュニティになると予測されています。

開発言語とライセンス

  • 言語の選択: PythonはAIリポジトリの中で最も好まれる言語ですが、Mojoのような新しい言語も注目されており、第四四半期にはGitHubでのスター数が73%増加しました。

  • ライセンスの傾向: AIリポジトリではApacheライセンスが好まれ、これは開発者が派生プロジェクトに関する特許を請求できることを意味します。一方、オープンなMITライセンスはGitHub全体で最も人気がありますが、Gen AI開発者はより保護的なライセンシングを好んでいます。

資金調達と投資動向

  • 資金調達の現状: 2022-23年にはオープンソースAIスタートアップの75%が資金調達に成功し、その中でも基礎モデルとモデルトレーニングソフトウェアが投資ドルの70%以上を引き寄せました。Nvidiaはこの分野での戦略的投資家として、Mistral AIやAdept AIへの投資を行っています。

パフォーマンスと効率性

  • 効率的なモデル開発: オープンソースAIの開発者は、大手技術企業が持つ広範なデータリソースや計算能力を持たないため、より高品質な結果を少ない計算要求で提供する効率的なモデルの作成に動機付けられています。例えば、Mixtral 8x7Bは、85Bパラメータの「専門家の混合」モデルでありながら、14Bモデルの計算能力で運用され、他のオープンソースモデルを効率性と有効性で上回っています。

GitHubにおけるオープンソースAIの動向と具体的数値

貢献者数とプロジェクトの増加

  • 開発者貢献の増加: 2023年、GitHubにおけるオープンソースAIプロジェクトへの開発者貢献は、前年比で148%増加しました。この顕著な成長は、オープンソースAIへの関心と参加の拡大を示しています。

  • プロジェクト数の急増: 同年、GitHub上のGen AIプロジェクトの総数は248%増加し、60,000を超えるプロジェクトが登録されました。これは、新しいAIアイディアとソリューションの探求が急速に広がっていることを示しています。

グローバルな規模の貢献

  • 国際的な貢献者の拡大: オープンソースAIプロジェクトへの貢献は、世界中で多様化しています。2023年は、特にインドと日本からの個別貢献者数が顕著に増加し、これらの国々が技術開発の新たな拠点としての地位を固めつつあることが示されました。

言語の選好とライセンス傾向

  • 開発言語の嗜好: GitHub全体でJavaScriptがトップのプログラミング言語である一方で、AI関連のリポジトリではPythonが最も好まれる言語であり、特に機械学習プロジェクトでのその優位性が引き継がれています。

注目されるプロジェクトとそのエンゲージメント

  • GitHubでの注目度: AutoGPTは、2023年に開発者からの顕著な関心を集めたプロジェクトの一例です。これは、大きなタスクを小さなサブタスクに分割し、それらを連続して実行することで結果を出す、自律的なAIアシスタントとして機能します。

  • プロジェクトへのエンゲージメント: PyTorchやHugging Faceなどのプラットフォームは、オープンソースAIの開発者コミュニティにおいて高いエンゲージメントを示しており、これらのリポジトリへの貢献者数は、リポジトリが活発に改善され続けていることを示しています。

結論

代替データサービスベンダーSynapticによると、オープンソースAIは革新の最前線に立ち、大企業のプロプライエタリなソリューションに対抗する十分なボリュームと品質を持っています。また、データへのアクセスがこれからの大きな挑戦となり、オープンソースAIの開発者たちは、より効率的で、地域のアプリケーションに容易に展開できるモデルを目指しています。この分野の急速な発展は、今後も多くの注目を集め、新たなイノベーションを生み出し続けるでしょう。

いいなと思ったら応援しよう!