
diary240921(o1-previewの楽しみ)
ChatGPTを久しぶりに課金した!
前回の記事にも書いたけど。
We're releasing a preview of OpenAI o1—a new series of AI models designed to spend more time thinking before they respond.
— OpenAI (@OpenAI) September 12, 2024
These models can reason through complex tasks and solve harder problems than previous models in science, coding, and math. https://t.co/peKzzKX1bu
数学とかコーディングとかが賢いらしい。
といってそんな博士レベルの数学問題とか思いつかないし…と思ってたらデフォにあったのでぽちってみた(一番左)。

自作GPTsだとこのままのテキスト「高度な数学の問題を解いてください」が入ると思うけど、公式の場合はちゃんと問題をいれてくれる。
Let $\mathcal{B}$ be the set of rectangular boxes with surface area $54$ and volume $23$. Let $r$ be the radius of the smallest sphere that can contain each of the rectangular boxes that are elements of $\mathcal{B}$. The value of $r^2$ can be written as $ rac{p}{q}$, where $p$ and $q$ are relatively prime positive integers. Find $p+q$
そもそもなんの問題かもわからないから、4oさんにきいてみた。
この問題は幾何学的な最適化問題の一種です。内容を整理すると、3次元の長方形の箱の形状に関する問題です。…
この問題は主に幾何学的な長方体と球に関する「包絡球」問題として扱われます。高度な数学的思考が必要ですが、少しずつ解いていくと面白いです!もし詳細な解法の手助けが必要でしたら、喜んでお手伝いしますよ🐻
o1-previewさんの結果
しばらく反応しないから連打したら同じ問題を2回といてくれた。
その1
思考時間110秒
制約を考える
cをできるだけ小さく設定し、与えられた制約に従ってaとbの和と積を計算。実数解の存在を確認するために2次方程式の判別式を求める。
ホワイトボードの前で立ち止まり、c=23c = 23c=23の場合の方程式の解を探し始めた。解の存在を確認すると無理数が現れ、他の方程式も解決策を持たない。
最大化の視点を変換中
aの最大化がr^2の増加につながることをチェック中。
解を求めるための試行錯誤
いくつかの値を試して、aとbの合計や掛け算を使ってa^2 + b^2 + c^2を計算し、r^2を見ている。
イメージを広げる
c = 1のとき、明確な解は見つからないんだね。これは、何か新しい方向を探る上での手がかりかもしれない。
なにいってるか意味不明という問題はあるけれど、とりあえずいいなって思ったのはときどき「ホワイトボードの前で立ち止まり、c=23c = 23c=23の場合の方程式の解を探し始めた」みたいな描写?がはいること。
Twitterとかみてるともっと楽しいことをはじめるAIさんもいる様子。
コード書いてる途中で急に魚を冷凍庫に保管し始めないで pic.twitter.com/BviUDbUika
— Plat 🖼️ (@p1atdev_art) September 19, 2024
その2
ちなみに2回やって答えは違う。
2回目の思考時間は143秒なのでかなり長い。ただしこっちの思考経過はそれほどみどころはなくて残念。
式の変換
$S$と$P$を$y$と$z$を使って定義し、方程式を変形して$S$と$P$の関係を明らかにしている。これにより、$x$と$S$の新しい式が得られている。
$x$の方程式を見直し, $x^3 - s x^2 + 27 x - 23 = 0$が同様の立方方程式であると気づく.
問題を絞り込む
この問題を解決するため、$t^3 - s t^2 + 27 t - 23 = 0$のすべての根が正の実数であるような最大の$s$を見つける必要があるんだ。 cartesの識別式が非負であることを利用し、根がすべて正の実数であるための$s$の範囲を見つけようとしている。
こちらの関数$f(t) = t^3 - s t^2 + 27 t - 23$を見ていると、重根を持つための最小の$s$を探し始めている。ハードルが多いけど、まずは$17/2$かな。
o-1 previewの楽しみ?
というわけで、この思考の経過部分のテキストが楽しい!
なのでo1-previewさんに長考してもらう問題を作りたいと思った。
他のAIさんに難しめの数学の問題考えて、とかで作れるかも。
もちろん数学の問題を純粋にときたいという場合、答えがあっているか検証できないというのは致命的だとは思うけど、思考の経過部分を読み物として読みたいということならなにも問題ないし。
ていうか。
たとえば創作で、数学とかの天才とかいうキャラがでてくるとして今までは具体的なエピソードとか作りにくかった(単なる暗算名人とか、なぜか黒板にe=mc^2とかなぐり書きしたがる変人とか)のが、ChatGPTの思考部分を参考にすればかなりよい雰囲気の脳内描写がかけそう。
IQも120くらいあるらしいし、現時点でもこんな評価あるみたいだし。
o1-previewの時点で著名な数学者テレンス・タオ氏からの評価がなかなか高い。
— The Cave (@AGI_to_ASI) September 15, 2024
今後1~2回改善されれば「有能な大学院生レベル」に達する見込みを持っていると。これならo1大型が来れば数学者も納得の成果が出せるのではないだろうか。
以下日本語訳… https://t.co/IqmhALgy7x
まとめ
久しぶりにClaudeとChatGPT両方課金してるわりには仕事忙しくて使いこなせてない。特にClaudeがあまりつかってない。
というか使いまくって上限に到達しまくりな頃の意識で、しょうもないことはpoeのhaiku使えばいいって温存してたら、haikuのあほさにいらいらして非効率的だった気がする。
3連休は有意義に過ごしたい。
それにしてもまさかこの時期まで猛暑日が続くとは思わなくてうんざり。
最近は体調最優先で(先週高熱出したし)睡眠時間確保を優先してるから、あんまり遊べないかもしれないけど体調崩すよかまし。
大谷さんも睡眠時間たっぷりみたいだし、つまり睡眠時間は人生のトータルでの効率をあげてくれるはず!
おわり