忘備録 Alibaba Cloud2025年1月28日AIモデル「Qwen2.5-Max」発表

アリババグループのAlibaba Cloudは、2025年1月28日に新しいAIモデル「Qwen2.5-Max」を発表しました。このモデルは、大規模なMixture-of-Expert(MoE)アーキテクチャを採用しており、200兆以上のトークンで事前学習され、その後、教師あり微調整(SFT)や人間のフィードバックに基づく強化学習(RLHF)によってさらに最適化されています。  

Qwen2.5-Maxは、以下のベンチマークで優れた性能を示しています:
   •   Arena-Hard:人間の好みを近似するベンチマーク
   •   LiveBench:一般的な能力を包括的に評価
   •   LiveCodeBench:コーディング能力を評価
   •   GPQA-Diamond:高度な質問応答能力を評価

これらのベンチマークにおいて、Qwen2.5-MaxはDeepSeek V3を上回る性能を示し、他の評価項目でも競争力のある結果を出しています。  

現在、Qwen2.5-MaxはAlibaba CloudのAPIを通じて利用可能であり、開発者は自身のアプリケーションにこのモデルを統合することができます。  

このリリースは、DeepSeekのR1モデルの登場に続くものであり、AI業界における競争が一層激化しています。  

いいなと思ったら応援しよう!