【論文まとめ】Them and Us: Autonomous Agents in vivo and in silico


【どういう論文?】

行為者性(エージェンシー)についての哲学を、人工知能に応用する論文。統一した主張があるわけでなく、いくつかの話題をまとめたもののようだ。

Millican P., Wooldridge M. (2014) Them and Us: Autonomous Agents In Vivo and In Silico. In: Baltag A., Smets S. (eds) Johan van Benthem on Logic and Information Dynamics. Outstanding Contributions to Logic, vol 5. Springer, Cham. https://doi.org/10.1007/978-3-319-06025-5_20

1、イントロダクション

行為者性について、大きくあわけて二つのアプローチがある。
一人称的立場:行為者とは意識的な目的により駆動される熟慮的行為の源である。
三人称的立場:「信念」「欲求」「理性的選択」などを帰属することで予測したり説明したりすることができる振る舞いをしているものが、行為者である。
この論文では、後者の三人称的立場を中心に、それをどのように人工知能に実装するかの研究を見ていく。

2、一人称的パースペクティブからの行為者性

では、一人称的立場から見てみよう。行為者とは、「目的を持った熟慮行為の意識を持つ源泉」であるという考え方だ。
この立場の基本的問題は、「行為をどのようにカウントするか、どのように個別化するか?」というものだ。
サールの古典的な例で説明しよう。1914年、ガブリロ・プリンチップはオーストリア皇太子を射殺して、それは第一次大戦を引き起こした。これは歴史上でも有名な「行為」だ。
しかし、プリンチップが行なった行為はどのようなものだろうか?
「指を動かした」「トリガーを引いた」「銃を撃った」「皇太子を暗殺した」「第一次大戦を引き起こした」
このうちのどれが彼の行為で、どれが違うか、基準があるのだろうか?

【「真性の行為」を身体内のものに制限する】
一つの基準は、身体の因果プロセスのみを「行為」とすることだ。
この基準の問題は、「筋肉が動いた」「ニューロンAのドーパミンが放出された」などの明らかに意識的でない現象も行為としてしまうことだ。行為はどこまでも分割されて無限後退に陥る。

【意識的に意図した行為を「真性の行為」とする】
では、一人称的に意識的に意図した振る舞いを「行為」とすればどうだろうか?
この基準の問題は、死後に達成したことも行為としてしまう一方、習慣的行為やプロのスキルなどの意識なしでできる振る舞いは、行為から外れてしまうことだ。

【「計画」を使った説明】
Bratmanなどの哲学者たちは、上の問題を解決するために「計画」を使って行為を説明する理論を作った。
『主体Sが計画Pを持っており、Pには少なくとも行為Aをすることの適切なガイドが含まれるときのみ、SはAを意識的に行う』という基準だ。
この解決策の便利な点は、「無意識のときに行為Aを含むような計画」を意図したときも、Aを行為したといえることだ。このことにより習慣的行為や自動的行為の存在を説明できる。

【一人称的立場と脳神経科学】
これらの一人称的立場は、「行為を同定するときに、一人称的視点が特権的なものとなるのだ!」という前提に立っている。

しかし、近年、脳神経科学の実験から、特に自由意志について我々の一人称的視点は当てにならないのではないかという疑問が呈されるようになった。例えば、マックスプランク研究所の実験では、被験者の意識的判断に遡ること十秒前の脳に、無意識的な相関が発見された。
このような自由意志への疑問に対してここで論じるには難しすぎるが、四つの短いコメントをしよう。
①自由意志と決定論は矛盾がないという両立論の立場からは、思考は無意識的プロセスで構成されているからといって、自由意志と矛盾しているわけではない。
②特定の脳における出来事と、意識的思考が相関していることは、驚くにあたらない。脳神経は我々が考えるためのメカニズムであるからだ。視神経が働いているからといっても「見ていない」といえないように、脳神経が働いているからといって「考えていない」とはいえない。
③意識は因果的な役割を持たずに脳活動に付随しているだけという付随主義は不合理である。進化において意識が生まれたからには、意識は適応的役割を持っているはずだ。
④もしも、反省的な決定においても、意識的に考えたときにはすでに結果は決まっていたということになるならば、確かに行為の直観的理解と脳神経科学は矛盾するであろう。しかし、付随主義のありえなさや、日常生活において意識的反省の有効性などを見ると、その可能性は極めて少ない。

3、三人称的パースペクティブからの行為者性


行為を、一人称的視点ではなしに、三人称的視点から帰属する説明として。Daniel Dennetの「三つの姿勢(スタンス)」理論がある。
デネットは、我々があるシステムを理解・予測するとき、次の三つの姿勢があるとした。

物理的姿勢:対象を物理的法則に一方的に従っているシステムと見なす。

設計的姿勢:対象をある目的を達成するために設計されたシステムだと見なす。

志向的姿勢:対象に心的状態(信念や欲求など)を帰属させて説明・予測する。この心的状態を使った推論を「素朴心理学」と呼ぶ。


4、高階志向性

一階の志向的システムは、「信念や欲求についての信念や欲求」を持っていない。
対して、二階の志向的システムは、「信念や欲求についての信念や欲求」を含む。

4.1、高階志向性と種の知性

この高階志向性は、複雑な社会で生きていくために適応的価値があるようだ。
Dunbarの研究では、霊長類の脳の新皮質サイズは、集団の平均サイズと相関していた。このことから、他者の思考を思考する高階志向性が、ヒトの脳サイズを大きくする淘汰圧になったと論じている。

5.人間の志向性システム


進化心理学者のSimon Baron-Cohenは人間の「マインドリーディング」を理解するために、Baron-Cohenモデルを考案した。

【Baron-Cohenモデル】

Baron-Cohenモデルは四つのメインモジュールから構成されている。
Intentionality Detector (ID):自己推進的動きや非ランダム音声の発生源を、目的や欲求を持つ行為者として解釈する。
Eye Direction Detector(EDD):以下の三つの機能を持つ。①「目」の刺激を検知。②目がこちらを向いているのか、他の何かを向いているのか計算。③もしも目が何かに向いているのであれば、その生物に「対象を見ている」という知覚状態を帰属する。
Shared Attention Mechanism(SAM):自分と他者と対象の三つの関係のなかで、見る-見られるの表象を作る。
Theory of Mind Mechanism(ToMM):他者の振る舞いから心的状態を推論する。行動を読むことで意欲的心的状態volitonal mental state(欲求や目的)を推論。目の方向を読むことで、知覚心的状態を推論する。

5.1 自閉症

Baron-Cohen仮説は、自閉症の原因は志向的システムの高階メカニズムにおける機能不全だというものだ。具体的には、SAMとTo MMの機能不全であるとされる。
自閉症児の調査では、絵や物語から人間の目的や欲求を正しく読み込むことができる。また、顔の写真から「彼はわたしを見ている」などの判断も可能だ。このことは、IDとEDDは一般児童と同じであることがわかる。
しかし、他者と目を合わせることなど共有活動ができないことから、SAMがうまく働いていないことが示唆される。
また、自閉症児は他者の心的状態の推論が困難であることから、ToMMにおいての失敗があると思われる。

6.行為者性と人工知能

この節では、自律的行為者となり得る人工知能の設計について考察する。

【論理主義的モデル】

人工知能研究の初期において、論理と論理的推論を中心に置く論理主義的伝統が盛んであった。

論理主義的伝統において、行為者のモデルは以下のような部分で構成される。

センサー:行為者の環境の情報を取得する。
エフェクター:環境に対しての行為を可能とする。
データストラクチャー「Δ」:行為者や環境の状態を表象する。
データストラクチャー「R」:行為者の理論を表象する。背景理論や、理性的選択の理論が含まれる。
変換器:センサーで取得した生データをΔで使えるように記号データに変換する。
一般目的論理推論コンポーネント(A general-purpose logical reasoning component):RをΔに適用することで、論理的結論を導き出す。また、新しいデータを元にΔをアップデートする。

行為者は、感覚-理由-行為のループを実行する。

感覚:センサーで環境を観察し、変換器で適切なプロセッシングを行い、論理形式の新たな情報を与える。この情報はΔに送られる。
理由:推論コンポーネントにて、シークエントを証明する。もしもこのシークエントが証明されたら、Δの表象は正しく、Rは適切に構築されており、αは適切なオプションとなる。
行為:αを実行する。

【論理主義的モデルの弱点】

この論理主義的なモデルは、いくつかの問題が生じる。例えば、以下のようなものだ。
・複雑で、動的で、複数エージェントが存在する環境を論理形式で表象するのは難しい。
・決断生成に役立つのような情報を、生データから論理形式として変換することが難しい。
・推論プロセスの自動化問題:
1980年〜1990年代前期において、多くの研究者が論理主義的伝統を諦め、別のアプローチを探ることとなる。

Δにはエージェントが集めて保存している全ての情報がある。このことは、直観的に、Δをエージェントの信念だと解釈できそうだ。

6.1 改良版:実践的推論エージェント

【実践推論】
現実の状況では、論理的証明を用いて決断をするという場面は想像しづらい。オルタネイティブな立場として、自律的エージェントの決断を、実践推論:信念ではなく行為に対する推論であるとする立場がある。
Bratmanは、実践推論を「考慮」と「手段結果推論means-ends reasoning」に分けた。

「考慮」:何を達成したいのかを決めるプロセス。考慮の結果、いくつか「意図」(特定の事態へのコミットメント)が固定化される。

「手段結果推論」:どのように事態を達成するのか決めるプロセス。そのアウトプットとして、「計画」(エージェントが実行できるレシピ)が生まれる。

実践的推論が完了することで、いくつかの意図(intentions)を選びとり、意図を実行するのにふさわしい計画を持つこととなる。
選択された計画を実行することで、欲求された結果が生じる。
信念、意図、結果、行為の間には、次のような実践三段論法の関係が成り立つ。
もしわたしがφを達成することを意図しており、
  わたしが計画πはφを成立させると信じているならば。
わたしはπをする。

【実践推論を実装した人工知能】

実践推論モデルはAIコミュニティに大きな影響を与えた。
実践推論エージェントは以下の三つのデータストラクチャー(記号的・論理的表象)を持つ。
「信念」:エージェントの環境の表象
「意図・目的」:現在、エージェントがもたらそうとしている事態の表象
「計画」:現在、エージェントが遂行しつつある一連の行為
もしも、エージェントの信念が正しくて、計画が健全であれば、計画を実行することで目的を達成する。

このモデルは「信念-欲求-意図(BDI)アーキテクチャー」と呼ばれる。エージェントはいくつもの矛盾した欲求を潜在的に保持しているが、目的や意図を決定するためにそのなかから選び、固定する。

BDIモデルにおいては、以下のような感覚-理由-行為 決断生成ループがはたらく。
感覚:外界を観察して信念を更新する。
選択肢生成:現在の信念と意図を鑑みて、可能な選択肢(それをもたらすことにエージェントがコミットできる事態)を決定する。
フィルタリング:現在の信念、欲求、意図を鑑みて、競合している選択肢のなかから選び出す。選ばれた選択肢は、エージェントの意図となる。
手段目的推論:信念と意図を鑑みて、計画を選び出す。信念が正しいとき、計画は意図の達成となる。
行為:計画を実行する。

【実践推論モデルの弱点と対応策】

このモデルには、論理主義と同じような問題が生じる。
・生データから論理的表象をもたらす変換器が必要だ。
・手段目的推論を論理的表象で表すと、あまりにも複雑になりすぎる。
これらの問題は反応的プランニング(reactive plannning)という手法である程度解決できる。これは、エージェントにあらかじめ複数の計画を実装しておくという手法だ。現在の意図に沿った計画をライブラリーの中から探し出すことで、複雑性を軽減してある程度扱いやすくしている。
このようなエージェントは「自律的」だといえるのだろうか?その問題に対して、以下の三つのコメントができる。
①「自律性」とは程度問題である。エージェントには様々な制限があり、「自分がコントロールしている」というための基準は無数にある。
②内的推論が少ないエージェントより多いエージェントの方が「自律的」といえるだろう。 
行為を決めるときに、潜在的可能性が多く、内的推論によりその一つを選び出すエージェントの方が、外部の命令をただ実行するエージェントよりも自律的だといえる。
③「自律性」は三人称においての志向的スタンスの理解と高い相関関係がある。

7、結論

この論文では、素朴心理学的な志向性スタンスから始まり、計画ベースモデルや人工エージェントの実践的発達について見てきた。
ここまで書かれてきた人工エージェントが文字通り「信念」や「欲求」を持った行為者なのかどうかということはわからない。しかし、十分に洗練されれば「信念」や「欲求」といった言葉を使って行動を予測して理解することはできるだろう。
未来への研究として、人工エージェントに使われるフォーマルな理論を、人間の振る舞いの予測や理解に応用できる可能性がある。

【感想】

わたしは作家=一種の志向的システムの創造者であるので、エージェントが何をやっているのか(どういう風に工夫すればエージェントに見えるのか?)という問題に興味がある。

エンタメ小説においては、「主人公が冒頭で問題を抱えており、事件(環境の変動)が起こり、そのなかで問題を解決する」というストーリー制作手法が典型的であるが、これはBDIモデルで描写できないか?環境変動によって信念が更新されて、新たな意図を選び取り、行為するというフィクションモデルだ。


この記事が気に入ったらサポートをしてみませんか?