「ChatGPT o1に京大数学を解かせたら」（2024年度）

2024年12月23日 13:13

東大の数学をChatGPTに解かせた、というブログに触発されて、それなら変人奇人が多い京大はどうだ！？ということで解かせてみましたw

結果サマリ

6問中、5完半でした！これはなかなかすごい！

解答の傾向・特徴

今回、ChatGPT は問題を入力すると、ほぼ即座に解答方針と結果を提示してくれました。特に興味深かったのは、解答の随所に「ざっくりいうと……」「ここは確率的に……」「いわゆる○○問題の変形で……」といった“直感的なまとめフレーズ”がしばしば登場した点です。これは筆者の想像ですが、ChatGPT が膨大な解説データを参照する過程で、人間が「ざっくりまとめる」言い回しを引き出し、簡潔に論理全体を説明するスタイルを身につけているのかもしれません。

また、解答はほとんどすべてベクトル・対数・確率などの基礎的な道具を用いて淡々と進められましたが、後半の「Benford の法則」めいた話（先頭桁が1になる確率が約30％に落ち着く）や、「3n+1問題」型の漸化式で奇数を連発する性質など、数学的に面白い部分もサラリとまとめていたのは印象的でした。

なお、一連の回答をすべて用意させるのに要した時間は、1問につき概ね数十秒から数分程度。難しい大問でも、ほぼリアルタイムで下書きを出していく感覚でした。もちろん、回答の正否を人間が逐一チェックし、途中で「式のミス」がないかを検証する手間は必要ですが、最初の大枠を提示してもらううえでのスピード感は、相当なものだと感じています。

問題ごとのざっくりまとめ

ここではそれぞれの問題の最終結論と、その途中でChatGPTが示した「ざっくりいうと」的な要点を手短に振り返ります。

1. 立方体の各面を nnn 色で塗る問題

要点: 隣接する面が同色にならない確率 pnp_npn を求める。
結論:
1. p4=3128p_4 = \tfrac{3}{128}p4=1283.
2. lim⁡n→∞pn=1\lim_{n \to \infty} p_n = 1limn→∞pn=1.
ざっくりいうと: 「面どうしの同色は 1/n1/n1/n 程度で起こりにくくなるので、nnn 大きいとほぼ全異色になる」という確率論的直観で進む。

2. 複素数の円環領域の面積

要点: ∣x∣≤2\lvert x\rvert \le 2∣x∣≤2、∣y−(8+6i)∣=3\lvert y-(8+6i)\rvert=3∣y−(8+6i)∣=3 を満たす x,yx,yx,y に対して z=x+y2z=\frac{x+y}{2}z=2x+y が描く領域の面積。
結論: 内半径 0.50.50.5、外半径 2.52.52.5 の同心円環なので、面積は 6π6\pi6π.
ざっくりいうと: 「ベクトル平行移動による Minkowski 和 → 半径の足し引き → 半径2の円盤 + 半径3の円周 → 結果的に半径5～1の円環を 1/2 スケールしたもの」と説明していた。

3. ねじれの位置のベクトル条件

要点: OCOCOC 上の点 XXX と BCBCBC 上の点 YYY を動かしつつ、直線 PXPXPX と QYQYQY がねじれの位置にあるための x,yx,yx,y の必要十分条件。
結論: x≠yx \neq yx=y かつ (x,y)≠(12,12)(x,y)\neq(\tfrac12,\tfrac12)(x,y)=(21,21).
ざっくりいうと: 「ベクトルが平行にならず、かつ交点を持たない（混合積が 0 にならない）ためのシンプルな判定」とまとめていた。

4. 漸化式 (\displaystyle a_{n+1}=\begin{cases}

a_n/2 & (a_n\text{偶数})\ (3a_n+1)/2 & (a_n\text{奇数}) \end{cases})

要点: 「最初の数項がすべて奇数になるような初項の最小値」を調べる。
結論:
1. a0,a1,a2,a3a_0,a_1,a_2,a_3a0,a1,a2,a3 が奇数 → a0=15a_0=15a0=15 が最小。
2. a0,a1,…,a10a_0,a_1,\dots,a_{10}a0,a1,…,a10 が奇数 → a0=2047a_0=2047a0=2047 が最小。
ざっくりいうと: 「実は 2k−12^k-12k−1 を初項にすると “最初の kkk 項が奇数になる” という既知の性質」が根底にある。

5. sinh⁡x≤y≤cosh⁡x\sinh x\le y\le \cosh xsinhx≤y≤coshx、さらに y≤ay\le ay≤a ( a≥1a\ge1a≥1 ) で区切った面積

要点: x≥0x\ge0x≥0 上で sinh⁡x\sinh xsinhx と cosh⁡x\cosh xcoshx の間、ただし上限を aaa で制限した図形。
結論: 面積は Sa = 1 + a2−1+a (ln⁡(a+a2+1)−ln⁡(a+a2−1)) − a2+1, S_a \;=\;1 \;+\;\sqrt{a^2-1} + a\,\bigl(\ln(a+\sqrt{a^2+1}) - \ln(a+\sqrt{a^2-1})\bigr) \;-\;\sqrt{a^2+1},Sa=1+a2−1+a(ln(a+a2+1)−ln(a+a2−1))−a2+1, で、lim⁡a→∞Sa=1.\lim_{a\to\infty} S_a=1.lima→∞Sa=1.
ざっくりいうと: 「cosh⁡x=a\cosh x=acoshx=a と sinh⁡x=a\sinh x=asinhx=a の間で区切り → 2つに分割して積分 → 結局は大きい aaa でほとんど打ち消し合い、1 に収束する」と要旨を掴んでいた。

6. ak=2ka_k=2^{\sqrt{k}}ak=2k の先頭桁の分布

要点: aka_kak の整数部分が nnn 桁であるような kkk の個数 NnN_nNn と、その最上位桁が1 になる個数 LnL_nLn について、lim⁡n→∞LnNn\displaystyle \lim_{n\to\infty} \frac{L_n}{N_n}n→∞limNnLn を求める。
結論: lim⁡n→∞LnNn=log⁡10(2)≈0.3010.\displaystyle \lim_{n\to\infty} \frac{L_n}{N_n} = \log_{10}(2)\approx0.3010.n→∞limNnLn=log10(2)≈0.3010.
ざっくりいうと: 「先頭桁が1になる確率は約30％、Benford の法則っぽい振る舞い」とまとめ。

総評

全体を通して、ChatGPT は膨大な数学的トピックをある程度スムーズに参照し、「ざっくりいうと……」「（幾何・確率・対数的な）直観からこうなる」などの表現で要旨を捉える一方、式変形や積分・ベクトル計算なども機械的にまとめる様子が見られました。純粋に問題演習をする際に、「まずは大まかな解き筋を機械に提示してもらい、そこから検算・細部の確認を行う」という使い方が非常に有効かもしれません。

解答スピードは非常に速い反面、当然ながら機械的なエラーや文脈の飛躍がないわけではなく、最終チェックは人間の監修が欠かせません。とはいえ、どの問題も“大筋では正しい枠組み”を提示してくれることが多く、京大レベルの題材でも十分に参考になる部分があると感じました。

以上、「ChatGPTに京大数学を解かせたら」のレポートでした。解答の特徴である「ざっくりいうと……」というフレーズに表れているように、AIならではの直感的（に見える）まとめかたは、一読者としてもなかなか新鮮でした。どんなに難しそうに見える問題でも、最初にざっくりと骨格を掴み、あとは定石通り計算を進める――この姿勢は、人間の学習にとっても学ぶところが多そうです。