
知能に動きによる記号接地問題の解決は必要か?
僕らはコップという概念と物理的なコップの実体をどのように対応させているのだろうか?
これはシンボルを実世界の意味とどのように結びつけるかという問題で、人工知能分野で記号接地問題と呼ばれている。そして、この記号接地問題を解決しないとヒトのような汎用人工知能は作れないという見方が主流である。
行動と記号接地問題
神経科学者のGyorgy Buzsakiは著書の中で以下のように記号接地問題の解決における動きの必要性を述べている。
We connect to the world not through our sensors (although they are essential) but through our actions. This is the only way that sensation/perception can become “grounded” to the real world as experience.
私たちは世界と感覚を通してではなく、行動を通してつながっている。(感覚は必須であるものの…)これは、感覚・認知が実世界に経験として"接地"するための唯一の方法である。
東京大学の松尾豊教授は知能の創出には動物OS、言語OSの2階建ての構造が必要であると述べており、これは動物OSによる強化学習で能動的に知覚した実体を言語OSが生み出す概念とマッチさせることで記号接地問題を解く必要があるということを主張しているものと解釈している。記号接地問題の解決に動きが生み出す知覚が必要という意味で本質的にはGyorgy Buzsakiと同様の意見のように思える。
大規模言語モデルと知能
一方で、2022年に世界をにぎわしたChatGPTは純粋な言語モデルであり、紹介したような記号接地問題の解き方をしていない。それにもかかわらず、ChatGPT等の大規模言語モデルが現状最も知能の実現に近いところにいるのは間違いないだろう。(ChatGPTによりシンギュラリティは起きつつあるのではないかという意見もあるが、CEOのSamuel H. AltmanもまだChatGPTは汎用人工知能ではないと述べている。)
それでは、汎用人工知能の実現に能動的知覚による記号接地問題の解決は必要なのだろうか?実体はなくとも概念上の情報処理だけで知能は生まれるのだろうか?これらはどうやら現段階では人工知能研究者にも分からないようで、この先の人工知能研究が出す答えが待ち望まれる。
参考文献
記号接地問題は人工知能の課題で、感覚ではなく行動で世界とつながるとされる。松尾豊教授は動物OSと言語OSの構造が必要とし、大規模言語モデルChatGPTもこの問題に取り組んでいる。人工知能の未来は未解明。
サムネイル画像はDALL-Eにより生成