
DeepSeek R1:OpenAI o1以上の性能と価格(動作させた動画あり)
DeepSeek R1とは?その概要と注目のポイント

DeepSeek R1は、中国のAIスタートアップDeepSeekが開発した最新の推論モデルです。2025年1月20日にリリースされ、その驚異的なコストパフォーマンスと性能の高さで注目を集めています。
OpenAIの高性能モデル「o1」に匹敵する性能を持ちながら、API価格はなんとo1の25分の1以下。さらに、MITライセンスでオープンソースとして公開されており、誰でも自由に利用・改変できる点が大きな魅力です。

DeepSeek R1の革新的な技術的特徴
DeepSeek R1がこれほどの高性能と低コストを両立できた背景には、革新的な技術が隠されています。
Mixture of Experts(MoE)アーキテクチャ
DeepSeek R1は「Mixture of Experts(MoE)」と呼ばれる特殊なモデル構造を採用しています。このアーキテクチャにより、合計6710億もの膨大なパラメータを持つ巨大モデルでありながら、実際に推論処理を行う際に使用されるパラメータは約370億程度に抑えられています。これにより、モデルの表現力を維持しつつ、計算効率を大幅に向上させています。
強化学習基盤の学習方法
DeepSeek R1は、初期バージョンである「DeepSeek-R1-Zero」から進化を遂げました。この初期モデルは、ゲームAIで知られるAlphaZeroのように、自己対戦を繰り返すことで推論能力を獲得する強化学習の手法を採用しています。
さらに、学習過程において、複数の回答候補を生成し、互いに評価し合うことで最適な解を見つけ出す「Group Relative Policy Optimization(GRPO)」という独自のアルゴリズムが用いられています。
蒸留(Distilled)モデルの提供
それほど高機能でないPCでもローカルで動作させられる蒸留モデルが提供されているのもDeepSeekの特徴です。800,000サンプルのデータセットでファインチューニングされており、推論性能を維持しつつ、計算リソースを大幅に削減しています。
Gitを使える方なら、ローカルにインストールして使えます。
DeepSeek R1はどれほど高性能?主要ベンチマークの結果
DeepSeek R1は、OpenAIのGPT-4oやAnthropicのClaude 3.5 Sonnetといった最先端のモデルと比較しても遜色のない、あるいはそれを上回る性能を発揮すると評価されています。OpenAI o1と比較しても、同等かそれ以上の結果が出ています。
AIME2024:正答率79.8%(o1は79.2%)
MATH-500:正答率97.3%(o1は96.4%)
Codeforces:レーティング2,029(上位3.7%)
※AIME(American Invitational Mathematics Examination):
アメリカ数学オリンピック予選

上の結果は、DeepSeek R1が特に数学的な推論能力やプログラミング能力において、非常に高い性能を発揮することを示しています。
実際に「colorful ping pong game」と入力したところ、自動的にプログラムして、動作させてみてくれました。
Mixture of Experts(MoE)アーキテクチャについてライティングしてもらうと、次のようにサクサク書いてくれました。
DeepSeek R1の圧倒的なコスト効率:なぜこんなに安いの?

DeepSeek R1の最大の魅力の一つが、その圧倒的なコスト効率です。APIの利用料金は、OpenAIのo1と比較して96%以上も低く抑えられています。

具体的な例として、入力トークンの価格はo1が100万トークンあたり15ドルであるのに対して、DeepSeek R1はわずか0.55ドルです。
この驚異的な低価格は、MoEアーキテクチャによる効率的な計算処理と、DeepSeekが構築した効率的な分散処理システムによって実現されています。
ただ、2025年2月8日以降のAPI価格改定が発表されており、Web版の無料プランへの影響は現時点で不明です。
DeepSeek R1の可能性を広げる活用事例と将来性
DeepSeek R1の高性能・低コスト・透明性という3つの特徴は、様々な分野での活用を可能にします。
教育分野での活用
推論プロセスを可視化できる透明性の高さから、DeepSeek R1は教育分野、特に数学やプログラミング学習における強力なツールとなることが期待されます。生徒は、AIが問題をどのように考えて解いているのかを理解することで、より深い学びを得ることができます。
ビジネス分野での活用
低コストで高性能なAPIは、企業が自社のサービスやアプリケーションにAI機能を組み込む際のハードルを大幅に下げます。特に、大量のデータを処理する必要がある場合や、コスト削減が重要な課題となっている場合に、DeepSeek R1は大きなメリットをもたらすでしょう。
今後の展開への期待と注意点
DeepSeekは、DeepSeek R1の正式版を完全オープンソース化し、技術報告書を公開する予定とのこと。これにより、世界中の開発者がDeepSeek R1の技術に触れ、その可能性をさらに広げていくことが期待されます。AI技術の民主化を大きく進める可能性を秘めていると言えるでしょう。 今後のDeepSeek R1の展開から目が離せません。
注意したい点
Lark、Difyなど、評判がよい中国製のツールが増えていますね。DeepSeekについても、入力したデータが中国のサーバーに送信されます。この点も踏まえて、機密情報の取り扱いには注意しながら使用することをおすすめします。
DeepSeekのプライバシーポリシーに下のように書かれているからです。
「当社は、お客様が当社のモデルおよびサービスに提供するテキストまたは音声入力、プロンプト、アップロードされたファイル、フィードバック、チャット履歴、その他のコンテンツを収集する場合があります。」
「当社は収集した情報を中華人民共和国にある安全なサーバーに保管します。」
DeepSeekセキュリティポリシー
https://platform.deepseek.com/downloads/DeepSeek%20Privacy%20Policy.html
kagitranslateでの翻訳版 セキュリティポリシー
DeepSeek Open Platform Terms of Service
https://platform.deepseek.com/downloads/DeepSeek%20Open%20Platform%20Terms%20of%20Service.html
https://platform.deepseek.com/downloads/DeepSeek%20Open%20Platform%20Terms%20of%20Service.html
Kagitranslateでの翻訳版 Terms of Service
ユーザー名、メールアドレスについても入力した場合は対象となります。メールアドレスは無料で作れますので、差しさわりのないメールアドレスにすることをおすすめします(もし無料でメールアドレスを作る方法をご存じないようでしたら、末尾のLINEからご連絡ください)。
Web版の左下から「My Profile」▶「Delete all chats」をタップするとチャットを削除できますので、気になる方は削除することもできます。

追記:
ちなみにDeepSeekに「DeepSeekを使うと中国のサーバーにデータが送られるのでしょうか?」と質問したところ、以下のような回答が返ってきました。

翻訳すると「申し訳ありませんが、私はまだこの種の問題について考える方法を学んでいません。私は数学、コード、論理的な質問が得意です。よろしくお願いします。」とのことです。
中国で検閲されていると言われている天安門の件などについてDeepSeekに聞くと、答えず、別の話題にそらそうとするという話もあります。
やはりWeb版では特に、一般的な漏れても問題のない情報を入力するようにして、セキュリティ上のリスクを減らすにはローカルで動作させるのがよさそうです。
この記事も読んでくださり、ありがとうございます!
ご参考になるところがありましたら、いいねしていただけると、とても嬉しいです♪
お問い合わせはこちらからお願いいたします。
