最初に言っておくが、僕は数学は全く苦手だ。数学が得意な人から見たらかなり的外れなことを言ってるのかもしれないが、僕にとっては切実な悩みなのである。「そんなのは簡単だよ」という人がいたらどうか教えて欲しい。
点がある。
これを0次元と言う。
点が横に並行移動して伸びて線になる。この線は無限大の長さまで伸びることができる。これを一次元という。
任意の長さ1の線が縦に1だけ動く、正方形になる。これを二次元と言う。
正方形を長さ1だけ今度は奥行方向に伸ばす。立方体になる。これを三次元という。
ここまでに「3つの方向」が出てきた。横、縦、奥行。
そのどれでもない四つ目の方向を考える。ただしこれは「時間軸」ではない。自由に行き来できる縦、横、奥行、ではない四つ目の「方向」だ。
立方体をそっち側の方向に動かす。これを超立方体といい、この空間を4次元という。
この長立方体をさらに「べつの方向」に動かす。これを五次元という。
これを繰り返していけば、いくらでも「高次元の超立方体」を作ることができる。
ただ、話はそう簡単ではない。
たとえば、0次元には移動という概念がない。
1次元には移動という概念が生まれるが、回転という概念がない。
2次元には回転という概念が生まれるが、回転軸は1軸しかない。
3次元の回転は「任意の回転軸」と「回転角度」で表現可能だが、それを数式で表現するには相異なる三つの虚数単位からなる複素数、いわゆる四元数が必要になる。
三次元の回転を表現するのに四次元の概念が必要になるということを考えて欲しい。実は二次元のベクトルの外積は三次元になる。
四次元になると回転軸が二つになる。もう直感的には理解できない世界になる。
人工知能のClaude-3に聞いてみた。
では五次元はどうなるか
実は現代物理学では11次元くらいまでは扱う。
だから11次元くらいまではその空間的性質がある程度知られている。
さて、ここまでは数学に詳しい方なら特に説明の必要はないだろう。
問題はこの先にある。
今現在、AIが扱うのは1万次元以上の空間である。
しかし、AI研究者は高次元の数学の性質についてほとんどケアしていない。ようやく最近、四元数を取り込み始めた程度なのだ。
というのも、次元が一つ増えるだけで考えたこともないことが起きるのが常で、おそらく11次元までの空間のこともまだ全てはわかってないに違いない。
でも我々が扱うのは1万次元以上、大規模言語モデルではトークンで4万次元、生成される結果は4096トークンなら1億6千4百万次元ということになる。
特に数学的性質の違いについて聞いてみる
こういう、次元が増えるほど話がややこしく複雑になっていくのを「次元の呪い」と言ったりするらしい。
ちなみに1億6千万次元ベクトルの類似度をどうやって測るか聞いてみた。
僕もLSHやt-SNEは使ったことがある。けど、次元削減は必ずしも有効な方法とは思えない。次元削減は鳥肌実と僕を「日本人」「男性」という尺度で「類似性が高い」と見做すのとあまり変わらない。
何が言いたいかというと、我々は高次元の性質についてほとんど完全に無知である。しかし、無知のままではいられないということ。
しかし、大規模言語モデルでは、超高次元を誰でも普通に扱うことが要求される。今後、文章や画像だけではなく動画や音声も扱うようになると次元数はどんどん上がり、「次元の呪い」は益々強まっていく。
次元が一つ上がるたびに複雑さは増していく。
もちろん長らくn次元(高次元)の研究はされているが、誰も直感的に5次元以上の世界をイメージできないだろう(それはたぶん人間の能力を超えてしまう)。
数学者は数式によって解き明かそうとするが、次元が1億を超えたらいちいちそこで出現する新しい現象を見つけることは難しい。
つまり何が言いたいかというと、もはやこれは人知を超えた研究なのではないかということだ。
「n次元にはベクトルがある」「n次元のベクトルは内積(cos)をとることができる」「n次元ベクトル同士はユークリッド距離を測ったり足したり引いたりできる」「n次元では回転ができる」「n次元ではトーリック多様体が存在する」は正でも、「n次元で起きることはあれとこれとそれが全てである」は正である保証はない。誰もそんな次元での操作を見たことも聞いたこともなければ想像することさえ難しいからだ。
人知を超えたことは、人ならざるAIにやらせるしかないではないか。
AIに一次元から十次元までの間にわかっていることを全て教えて、そのあと、AIがAI自身の発見によって仮説と理論を補完し、新しい理論を構築し、それを1億6千万次元まで繰り返していくと、もしかすると我々にとって全く未知の概念、つまり二次元の生物には想像さえできない「三次元的な回転」や「ねじれの位置」といった関係性が、1億6千万次元までに10億個以上発見されてもおかしくない。それは結局人知を越える。1億もの事柄を理解することは普通の人間には不可能だ。
「名詞を100個挙げて」という問いには大抵の人は答えることができる。すごく賢い人なら「1万個挙げて」もできるかもしれない。でも「1億個」は無理だ。そもそも1億とか数えたことない。一秒に一回名詞を思いつくとすると、寝ずにやっても1億まで数えるには3年かかる。
「回転」くらい基本的な操作が1億種類もあったらそれを同時に人間の頭が処理することはできない。俺たちは最終的に「なんとなくAIを使う」ことしかできないのだ。
だから「高次元」という厄介な問題を扱うもっと別の方法が必要になるはずなのである。
僕は数学に詳しくないので今知ってることだけで想像するしかないのだが、「高次元を理解するAI」の開発と、「高次元を理解せずに人間が扱うもっとマシな方法」の研究はもっと活発になされるべきなのだ。
もう計算資源では日本は世界に全く対抗できないので、数学の研究にもっと力(助成金?啓蒙活動?わかんないけど)を入れるべきだ。
賢さというのは唯一、財力や生まれ持っての境遇に対抗しうる手段なのだから。
たぶんAI以後の世界で最も価値を持つのは「数学者」である。しかも「高次元幾何学」ないし、それを上回るくらいの概念を発明する数学者だろう。
それこそが心理歴史学なのかもしれないが。