「DeepSeek V3」というAIが数学に強すぎる。
こんにちは。Niiです。
DeepSeek V3は中国発のAIで、ChatGPTとGeminiと同様の仕組みで動いています。私はChatGPTは無料プランを使っているので、2024年12月にリリースされたo1シリーズの能力を知らないのですが、DeppSeek V3で利用できるDeepthink機能は思考する力に長けているように感じます。
DeepSeek V3を使ってみよう
中国製は怪しい、と思っている人もいるかもしれませんが、オープンソースで公開されているので、セキュリティは大丈夫だと思います。
こちらから入り、新規登録/ログインしてください。
難解な数学の問題を解かせてみた。
まずは、数学検定1級の問題から。これらの問題は大学で履修する範囲で、これを解けたら、大学の数学の範囲を解ける、と同義と捉えることができます。
数検の公式ページの過去問から問題を持ってきました。著作権の影響もあるので、結果だけ言います。
DeepSeek V3は3問中3問正解、ChatGPT 4oは3問中2問正解しました。どちらも思考プロセスは似ており、ChatGPT 4oは計算ミスをしていました。解答にかかった時間はどちらも同程度です。
次に、数学オリンピックの問題。マスターデーモンと呼ばれる特に難問を持ってきました。
結果、DeepSeek V3は2分35秒の時間を経て正解しました。数オリ参加者の正解率は5.2%、正解した人も今なスピードで解けたわけでないと思います。流石。
ChatGPT 4oは20秒で正解しました。早すぎだと思って、この問題を元々知っていたか聞いてみたところ、問題はもちろん、解き方も既に学習済みだそうです。DeepSeek V3はそうではないので、本当にすごいと思います。
無料でこの能力ですよ。ぜひ使ってみてください。
実際に解いたやつ↓( GPT 4o)
(DeeSeek V3は共有できませんでした。すみません。代わりにプロンプト載せときます。)
【Find the all values of n, which ((2^n+1)/n^2) is integer. Here n is integer greater than 2 or equal to 2.】