見出し画像

「DeepSeek V3」というAIが数学に強すぎる。

こんにちは。Niiです。

 DeepSeek V3は中国発のAIで、ChatGPTとGeminiと同様の仕組みで動いています。私はChatGPTは無料プランを使っているので、2024年12月にリリースされたo1シリーズの能力を知らないのですが、DeppSeek V3で利用できるDeepthink機能は思考する力に長けているように感じます。

DeepSeek V3を使ってみよう

中国製は怪しい、と思っている人もいるかもしれませんが、オープンソースで公開されているので、セキュリティは大丈夫だと思います。

こちらから入り、新規登録/ログインしてください。

https://chat.deepseek.com/

難解な数学の問題を解かせてみた。

 まずは、数学検定1級の問題から。これらの問題は大学で履修する範囲で、これを解けたら、大学の数学の範囲を解ける、と同義と捉えることができます。
 数検の公式ページの過去問から問題を持ってきました。著作権の影響もあるので、結果だけ言います。

DeepSeek V3は3問中3問正解、ChatGPT 4oは3問中2問正解しました。どちらも思考プロセスは似ており、ChatGPT 4oは計算ミスをしていました。解答にかかった時間はどちらも同程度です。

 次に、数学オリンピックの問題。マスターデーモンと呼ばれる特に難問を持ってきました。


マスターデーモン

結果、DeepSeek V3は2分35秒の時間を経て正解しました。数オリ参加者の正解率は5.2%、正解した人も今なスピードで解けたわけでないと思います。流石。
ChatGPT 4oは20秒で正解しました。早すぎだと思って、この問題を元々知っていたか聞いてみたところ、問題はもちろん、解き方も既に学習済みだそうです。DeepSeek V3はそうではないので、本当にすごいと思います。


無料でこの能力ですよ。ぜひ使ってみてください。

実際に解いたやつ↓( GPT 4o)

(DeeSeek V3は共有できませんでした。すみません。代わりにプロンプト載せときます。)

【Find the all values of n, which ((2^n+1)/n^2) is integer. Here n is integer greater than 2 or equal to 2.】


いいなと思ったら応援しよう!