見出し画像

『記号創発ロボティクス』を読んだ

谷口忠大先生の「記号創発ロボティクス 知能のメカニズム入門 (講談社選書メチエ)」を読んだ.記号創発ロボティクスとは,環境とインタラクションする身体を持つロボットがいかにして言語を獲得するかを構成論的アプローチで検証する研究領域であり,この本では近年の研究動向が紹介されている.

この記事では,本書を参照しつつ,本書でも取り上げられている『AIにおける教師あり/なし学習』と『記号創発』の概念を少し掘り下げて感想を書きたい.


時に僕には一つの悩みがある.それは「面白いと思う感度があまり高くない」ということである.
例えば,自分の横を通った車の車種を知ろうと思わないし,今目の前にいる人の服のブランドを知りたいと思わない(よっぽど特徴的だったり,好みの場合は別だが).それは単なる「車」であり,「洋服」でしかない.
抽象的なラベルを付けて世界を認識しているのかもしれない.

実はこれが,教師あり学習を施されたAIと同じではないかということに気づいてしまった.例えば,AIの画像認識タスクの一つとしてセマンティックセグメンテーションというものがある.これは,画像内の領域をラベルに従って塗分けるタスクである.

引用元: https://pub.towardsai.net/machine-learning-23997460cbc4

AIモデルを学習させるには,正解データが必要である.上記画像のような色分けされた大量のデータを学習して,AIは未知のデータに対してもRoadやVehicleが認識できるようになる.ここで厄介なのは,正解データを人間が作る必要があるということである.その際,車の車種や,道路の材質など事細かにラベリングすることは非常にコストがかかるし不可能である.
そこで,ある程度大きなカテゴリをもとに正解データを作成するのが一般的だ.

僕の世界に対する認識が,大きなカテゴリでしか物事を見れないこのAIのようになってしまっているのではないかと思ったのである.

そんな自分を脱却したいと思った.
そして,そんな時ニーチェの哲学がこの悩みの解決の糸口になると思ったのである.
特に僕には,ニーチェの言うところの『現存』に類する意識が必要だと思った.

とりあえず,ニーチェの哲学の一部を紹介する.

ニーチェの哲学における「末人」「超人」「現存」について、簡単にまとめます。
1. 末人(Last Man)概要: 「末人」は、ニーチェが『ツァラトゥストラはこう語った』で描いた、未来における人間の退廃的な姿です。
特徴: 創造性や高い目標を追求せず、安逸と平凡さを求める人々です。彼らはリスクを避け、現状に満足し、深く考えることを嫌います。挑戦や成長を避けるため、個々の可能性が抑制されます。
ニーチェの批判: ニーチェは末人を「小さく、安全で平凡な存在」として否定的に捉え、彼らの生き方を進化的な退行として批判しました。

2. 超人(Übermensch)概要: 「超人」は、ニーチェが提唱する理想的な人間像で、自己を超越し、自らの価値を創造する存在です。
特徴: 超人は、既存の道徳や価値観に囚われず、自らの意志で新しい価値を創造します。彼らは力強く、積極的に挑戦し、人生を肯定的に捉えます。
意義: 超人は、自己超越を通じて人間の可能性を最大限に引き出す存在であり、ニーチェにとっては未来の理想的人間像です。

3. 現存(Presence)概要: 「現存」は、ニーチェの哲学において、過去や未来に囚われず、現在の瞬間を完全に生きることを指します。
特徴: 現存は、感覚と感情を鋭くし、今ここにある体験に深く関わることを重視します。過去の後悔や未来の不安に囚われず、現在を最大限に享受することが求められます。
ニーチェの強調: ニーチェは、人生を「永劫回帰」の概念で捉え、すべての瞬間を何度も繰り返して生きる覚悟を持つべきだと考えました。そのため、現存は自己の生き方を積極的に肯定する態度とも結びついています。

chatGPT 4oより

つまり,今この瞬間を生き,生きていくうえで獲得した物事に対するラベルや固定観念の一切を忘れて,ものそのものと対峙する感覚が今の自分には必要だと思ったのだ.


僕自身の気づきはさておき,このニーチェの現存の感覚が僕自身にとって重要だったということは,AIにとっても重要であるということにならないかと思ったのである.

上記で紹介したセマンティックセグメンテーションモデルは言うまでもなく人間のラベルで学習されたAIであり,世の中に存在するAIの多くは,この「教師あり学習」で訓練されたAIなのである.

一方で,近年大流行中のLLMは「教師なし学習」で実現されたAIモデルである.LLMは「next token prediction」と呼ばれる,文章の次に来る単語を予測することで学習をしている.LLMが創発的な能力を有する所以は,この「教師なし学習」が大きく起用しているともいえる.
ただ,GPT-4oなどのマルチモーダルな機能を持ったLLMはどうだろうか.GPT-4oは,画像を認識してその画像に対する質問応答ができるが,どのように学習したのか.たいていはwebから集めた画像と画像のキャプションのペアデータから学習されている.

引用元: https://laion.ai/blog/laion-5b/

言うまでもなく,これらのデータは人間によって作成されたものである.
つまり何が言いたいかというと,GPT-4oですら人間の理解の範疇で言語化されたものに対する認識しかできないのでは?ということである.

「AIが人間を超えるか」という観点でよく議論がなされているが,たしかにすべての人類の集合知と呼べるようなAIはすでにできているし,今後ますます発展していく.
しかし,人間が作り出した「記号」であるラベルや言語を超越して,その瞬間その場所に存在する,ものそのものを知覚する力は果たしてAIに生まれるのだろうか.そんな疑問が僕の中で生まれてきた.

また,ある種特殊な記号,例えばペットの名前や,友人のあだ名をLLMは簡単に理解することは簡単ではない.人間が作り出した言語と,日々刻々と生まれ変動する記号,その環境に順応するAI,これらをの関係からAI,ひいては人間を理解しようとする記号創発システムは非常に面白い分野であると思った.

終わりに

この記事では,「記号創発ロボティクス 知能のメカニズム入門 (講談社選書メチエ)」を読んで考えたことをとりあえずまとめてみました.まだまだこの分野の知識が浅いため,今後この記事の加筆修正していく可能性もあるかと思いますので何卒よろしくお願いいたします.

この記事が気に入ったらサポートをしてみませんか?