見出し画像

chat GPTに数学の問題を作らせてみた!第一弾

こんにちは。
今回はchatGPT o1モデルが数学の思考能力がどれくらいあるのかを試すために問題を作ってもらい、それを実際に解かせて確認してみようと思います。

難易度としては、日本の大学入試問題を想定した現行の高校課程の数学の道具を用いた問題を想定して作ってもらいました。
実際に用いたプロンプトは非常に長かったのでこちらに添付したファイルの中に入れてあります。

作成された問題はこちら

整数問題みたいですね。
ぱっと見、難解そうではありませんがしっかり解こうとするとなかなか難しいのでしょうか。整数問題でよくある、そもそもそんなに大きい整数では左辺か右辺かのどちらかが大きくなりすぎてしまうため、範囲を絞ることができるといったアプローチがすぐに浮かぶところですが、仮に左辺が非常に大きくなったところで、x,y,zの間にこれといった制約はないため、zを大きくしてしまえば済むことです。このアプローチは使えないでしょう。次はあまりに注目して考えるというアプローチだなと思いながら付随していた解答に目をやったところ、あたりでした。
以下GPTの出力を示します。

解答

この問題では、正の整数 x,y,zx, y, zx,y,z が方程式 2x+3y=z22^x + 3^y = z^22x+3y=z2 を満たす条件を満たす全ての組み合わせ (x,y,z)(x, y, z)(x,y,z) を見つける必要があります。以下に、詳細な解析と解法を示します。

ステップ1: 方程式の基本的な解析

方程式は指数関数と平方数が関与しています。まず、方程式を満たす x,y,zx, y, zx,y,z の可能性を絞り込むために、以下の点を考慮します。

  1. 方程式の性質:

    • 2x2^x2x と 3y3^y3y は共に増加関数であり、z2z^2z2 も増加します。

    • よって、方程式を満たす解は有限または特定のパターンに従う可能性があります。

  2. モジュロ解析:

    • 方程式を小さな法で解析することで、解の存在可能性を確認します。

ステップ2は式が多かったので画像で。

ここから具体的な数値計算が続き、最終的には

このような結論を出していました。
結果としては(x,y,z) = (4,2,5)しかないという結論を出力していました。
まぁそれっぽいといえばそれっぽい。実際には非常に多くの場合について計算をしているはずですから、僕らが計算可能な範囲では少なくともこれ以外に答えは見つからなかったのでしょう。
ただ、これを学校などで扱う数学の問題としてみると、全然答案としては成立していません。答えが仮に上記のものだけだったとしても、それ以外に存在しない、もしくはそれが唯一の解である証明はもちろん必要です。
ですので自分なりに答えを考えてみました。
以下に示しますが非常に字も雑で見るに堪えないと思うのでアプローチだけ先に述べておきます。

まずGPTが示してくれた通り、mod3で考えるとxが偶数であることが示されるのでそれに従ってxを変換します。
その後問題の式にそれを代入して処理を行うと因数分解が一部で可能で、そこから二つの関係式を得ることができます。
その一方の関係式からyの偶奇を決定することができ、x,yどちらも偶数であることが分かったわけなので、元の問題文と合わせて、ピタゴラス数を用いた議論に進むことができました。
あとはピタゴラス数に関して用いることができる定理を使ってさらに関係式を示し、結果的にxに関する方程式を導き、答えがただ一つ(4,2,5)であることを示すことができます。

字が汚くてすみません。

僕の計算が合っている保障はどこにもありませんが、一応問題として明らかな破綻はないことを確かめることができました。
今までは支離滅裂だったり、実は全く中身のない一瞬で解決できてしまう問題ばかりを出力していたことはchatGPTを今まで使っていた方ならなんとなく感じることだったと思うので、多少考えないととけないような、それでいて機械でないとできないような繁雑な計算を必要ともしない問題を作成できるようになったというのは、o1になってできるようになったこととして十分にカウントして良い感じがしますね!

実はこの問題、軽量化されたo1-miniモデルで作成されたものです。
o1モデルを用いて作成したら、、?どうなるでしょうか
問題だけならすでにあるのですが、、自分自身全然理解できる気がしません。検証できる気もしません。
数学に自信のある方ぜひ挑戦してみてください。
もう少し進歩したら、記事にすると思います。ではではまた!
ここまで読んで下さりありがとうございました!

難問とは言ったけども、、すごいな

いいなと思ったら応援しよう!

この記事が参加している募集