「AGI」という言葉の倫理性と付き合い方
筆者: 矢倉 (マックス・プランク人間開発研究所)
OpenAI が o3 と呼ばれる新たなモデルを発表し、話題を呼んでいる。特に、LLM には解くのが難しいとされてきた ARC-AGI というベンチマークタスクにおいて、人間に比肩するパフォーマンスを出したという点 [1] は「AGI(汎用人工知能)時代の到来」として衝撃を持って受け止められている。しかし、私は「AGI」という言葉の使われ方に一抹の不安を抱いている。なぜなら、計算機科学分野の、かつその一部である機械学習コミュニティにおいて工学的要求から定められたベンチマークが、社会全体における「(人間の)知能」の定義を揺れ動かす可能性を感じているからだ。
![](https://assets.st-note.com/img/1735061160-X9dJcRkZtqev4EuhNpCrVGPw.png?width=1200)
機械の「知能」が人間のレベルを超えたかどうかを議論することは、必然的に「人間の知能のレベル」を定義することを伴う。例えば、上図は ARC-AGI のタスクの1つだが、私は回答の糸口が掴むまでにかなりの時間を費やした [注1]。これは、私の「知能レベル」が低いからなのだろうか。また、人には得手・不得手がある中で、ARC-AGI のタスクが苦手な人は「汎用的な知能」を持たないということになるのだろうか。
我々は、自分たちの「知能」をどう定義し、どう測るかという点について多くの失敗を重ねてきた。例えば、それぞれの得意・不得意を見極め、特別な支援を必要とする子を見つけ出すために開発された IQ テストは、特定の集団に対する偏見を生み出し、差別するための根拠として用いられることになった [2; 注2]。こうした過去をどう乗り越え、向き合うのかという点には、いまも真摯な議論が求められている [3]。そんな中で、特定のベンチマークタスクの結果にのみ基づいて「汎用的な知能」のボーダーラインを議論することに、危うさがないだろうか。
もちろん、ARC-AGI の提唱者である François Chollet が「ARC-AGI に合格しても AGI が達成されるわけではない(Passing ARC-AGI does not equate to achieving AGI)」と述べている [1] 点は留意せねばならない。それどころか、多くのモデルが苦手とするようなタスクのベンチマークを作ることで、AI モデルの飛躍的な進化の土台を作るという工学的な立場には大きく共鳴する部分がある(その結果として実際に、o1 から o3 への進化が生まれたと言えよう)。
また、AGI という考え方そのものを忌避すべきかというと、そうは思わない。なぜなら、科学研究には「夢」が必要だからだ。「金の国」を求めた大航海時代の人々が天文学や造船技術の進歩の原動力となったように、J. F. ケネディの演説が生み出した熱気がアポロ計画を支えたように、人間を超える「知能」を生み出すというビジョンが、AI 研究を支える大きな力の1つとなっていることは間違いない。また、いまや AI 研究を民間資本なしに進めることは想像し難い中で、AGI 実現の可能性に対する投資が資本流入を下支えしている部分もあるだろう。
ただ、社会に受け入れられる技術を作り出していくには、社会に対して丁寧なコミュニケーションを行う必要がある。「大きな夢に向かって研究を進める」というメタ的な方法論に取り込まれてしまったり、「現在の技術に足りない部分をベンチマークタスクとして整備することで技術開発を促す」という工学的要求に基づくアプローチを過大評価したりして、過去の過ちを繰り返すことは避けたい。万に一つでも、AI 技術に何らかの暗い歴史が紐づけられ、使ってはいけないようなものとされてしまうことになるのは、AI 分野の研究に携わってきた身としても望まない。
そもそも「知能」の定義というものも、時代の変化の中で塗り替えられてきた。ARC-AGI の端緒となった論文では「経験や事前知識を基に新たなスキルを導ける度合い(the rate at which a learner turns its experience and priors into new skills)」としているが、こうした論理的な推論能力が重要とされるようになったのは近世以降ではないだろうか。例えばユダヤ教世界が、口伝トーラーを暗記して後世に伝えることを賢者の役割としてきたように [5]、またトマス・アクィナスが、「記憶」を人間の知的能力の重要な構成要素とみなし記憶術についての著作を残した [6] ように、印刷技術が生まれるまでは暗記能力が「知能」の大きな尺度とされていた。よりわかりやすい例では、コンピュータによる文書作成が広まるまで、字の綺麗さが知性を表すものとみなされてきたこと [7] は記憶に新しいだろう。
このように、技術との関係性の中で人間は、自らの能力を解体して外部化しながら、「知能」の定義をも柔軟に変えてきたのである。そして、これはなにも「知能」だけに留まらない。写真技術によって「現実世界をいかに複製するか」という芸術の価値が入れ替わり、遊戯的な形を取る現代芸術とそれを支える社会的合意が生まれたように [8] 、人間は技術を通して自らを相対化し、適応的に価値観をアップデートさせてきた。
![](https://assets.st-note.com/img/1735070565-UkXzVT25O3ferCdsqi1lNbh4.png?width=1200)
「複製」を前提にした新たなアプローチを生み出した(出典: WikiArt)
AI の論理的な推論能力が人間を超越する日はそう遠くないかもしれない。ただし、それは必ずしも人類の破滅を意味するわけではない。むしろ、そうした世界観をいち早く実現したのが棋界である。AlphaGo がチャンピオンを破って以降、AI を取り入れたプロ棋士たちはこれまでの歴史にない手を続々と生み出しているという [9]。
![](https://assets.st-note.com/img/1735070747-v2gOyG6C8VonSQsqjUFiYtDl.png?width=1200)
人間が、そのアイデンティティからなにかを手放そうとすることを、悲しいことだと捉える人もいるかもしれない。しかし個人的には、「Tyranny of Logical Thinking(論理的思考の王国)」を卒業した人類がどういったニッチを次に見つけ出すのかという点を楽しみにしているし、いち早く明らかにできればと考えている。そして、(いわゆる)AGI が生み出されるのだとしたら、それをポジティブに、ただし地に足ついた形で社会に届けられる足場を提供できれば幸いである。
おまけ
さきがけ「社会変革基盤」の課題として「機械学習時代の社会変容を理解する基盤アプローチの創出」と名付けたのは、AI 技術がもたらすこうした価値観や社会規範の変化を明らかにし、健全な付き合い方を促す技術やベンチマークを作っていきたいという狙いによるものです。こうした問題意識に興味のある方はぜひお声がけいただけると嬉しいです。
また、本記事は HCI Advent Calendar をきっかけとして執筆したものですが、あまり HCI っぽい内容ではないのでまた機会があれば別のトピックで書いてみようと思っています。
注釈
幸い、o3 もこのタスクは解けなかったらしい。
当書には、過去研究の解釈や進化生物学の捉え方について批判がある [10] ことを付記しておく。
参考資料
[1] François Chollet. 2024. OpenAI o3 Breakthrough High Score on ARC-AGI-Pub. https://arcprize.org/blog/oai-o3-pub-breakthrough.
[2] Stephen Jay Gould. 1996. The Mismeasure of Man (2nd ed.). W. W. Norton & Company.
[3] Nature Editors. 2017. Intelligence research should not be held back by its past. Nature, 545, 385–386.
[4] François Chollet. 2019. On the Measure of Intelligence. arXiv, 1911.01547, 1–64.
[5] 市川裕. 2019. ユダヤ人とユダヤ教. 岩波書店.
[6] フランセス・イエイツ (青木信義ほか訳). 1993. 記憶術. 水声社.
[7] 荻布 優子ほか. 2023.「正しく整った文字」を書くことは学力に関連するか―2種の漢字採点基準における書き成績と学力との関係の比較―. 特殊教育学研究. 61(3), 123-132.
[8] ヴァルター・ベンヤミン (久保 哲司訳). 1995. 複製技術時代の芸術作品.ベンヤミン・コレクション〈1〉近代の意味. 筑摩書房.
[9] Minkyu Shin, et al. 2023. Superhuman artificial intelligence can improve human decision-making by increasing novelty. Proc Natl Acad Sci U S A, 120(12), e2214840120.
[10] J.Philippe Rushton. 1997. Race, intelligence, and the brain: The errors and omissions of the ‘revised’ edition of S. J. Gould's the mismeasure of man (1996). Pers. Individ. Differ. 23(1), 169–180.