AIが人間の心を読めるようになる日は来るのか?~不完全情報ゲームで分かる推定と判断の難しさ
ずっと恋い焦がれていた女の子に、勇気を振り絞って告白した男の子。永遠と思われるほど長い一瞬。
でも、彼は気づいてしまいます。女の子の答えがポジティブではないことを。彼女の眉間の緊張から、無意識に深く吸い込んだ胸の動きから、そして、目の奥に見える光の暗さから。
もちろん、男の子が得た情報は、断片的で「不完全」な情報です。それでも、なぜか人間は分かってしまう。これほどあいまいで多義的な情報から「隠された本当のこと」を理解し、適切に判断(意思決定)できるのです。
さて、これほど不完全な情報しか得られない実世界で、コンピュータが人間のように理解・判断できるようになる日は来るのでしょうか?
***
コンピュータサイエンスでは、コンピュータにゲームをプレイさせる研究が古くから取り組まれてきました。環境内のある状況においてコンピュータに意思決定させたとき、その良否を「ゲームの勝敗」で評価できるからです。
コンピュータによるゲームプレイの研究は、情報理論の創始者として知られる数学者シャノンが、1949年にコンピュータにチェスをプレイさせるアプローチを発表したことが始まりです。
その約50年後の1997年に「ディープ・ブルー」がチェスの世界チャンピオンに勝利します。そして、2013年には「Ponanza」が将棋でプロを下し、そのわずか2年後の2015年には「AlphaGo」が囲碁でもプロに勝利しました。
いずれの研究も、コンピュータサイエンスの歴史におけるマイルストーンとして、価値ある成果に違いありません。コンピュータを有効に活用し、工学的に極めて難易度の高い課題を解ききったのですから。
実際、その研究の意義を示すために、AlphaGoの開発者たちは、それを発表する論文の冒頭からコンピュータ囲碁に取り組む難しさを強調しています。
The game of Go has long been viewed as the most challenging of classic games for artificial intelligence due to its enormous search space and the difficulty of evaluating board positions and moves.
訳:囲碁は、探索範囲が広く、盤面の配置とその動きを評価することが難しいため、人工知能にとって最も難易度の高いクラシックゲームとみなされてきた(藤田訳)。
出典:「Mastering the Game of Go with Deep Neural Networks and Tree Search」
しかし、私はこれらを「人工知能の研究」と呼ぶことに違和感を覚えます。なぜなら、これらの研究は「完全情報」を仮定しているからです。
完全情報とは、環境内の状態に関する情報がすべて観測できる状況を言います(そのため「完全観測」とも呼びます)。ゲームの場合、チェス・将棋・囲碁など、各局面において盤面・持ち駒などが各プレイヤーに漏れなく開示されるゲームがこれに該当します。
すべての情報が与えられているなら、解決すべき課題は「効率的な探索」に絞られます。
つまり、現在の局面が今後どのように変化するかを先読みし、自分にとって有利な形勢となる局面を発見し、それに至る最善のプレイを特定する……広大な探索空間に対して、この過程をいかに効率化するかが課題となります。
もちろん、機械学習の分野における最新の知見をこの効率化に援用し、「人間より強い」を実現したことは、工学的な意義が大きいと思います……が、「効率的な探索」が課題である以上、コンピュータの性能向上に伴って完全情報ゲームが扱いやすくなることは……まあ、当たり前ですよね。
極端な話をすれば、囲碁・将棋の状態空間をすべて探索できるほどその性能が上がれば、完璧な先読みでコンピュータが必勝できるでしょう。
しかし、果たしてこれは「人工知能」と言えるでしょうか?
私の答えは「ノー」です。
なぜなら、それは単なる「超高速ソロバン」としか思えないからです。
つまり、これらの研究は、シャノンの時代から取り組まれてきた「探索」に関する研究と方向性がほとんど変わらず、「人間の理解・判断に関する本質的な仕組みを追求する」という理学的な側面に乏しいと思うのです。
だから、「完全情報」という特殊な状況を仮定するゲームでコンピュータが人間に勝利した成果を敷衍しても、それが「女の子の答えがポジティブではない」と判断する人間的な側面を模倣することは、永遠にできないでしょう。
そういう意味で、私はこれらを「人工知能の研究」と呼ぶことに少し抵抗がありますし、人間のトッププレイヤーに勝ったことをもって「人工知能が人間より賢くなった」と言うことには否定的です(「コンピュータサイエンスの進歩」とは間違いなく言えるのですが)。
***
これに対して、コンピュータに不完全情報ゲームをプレイさせる研究には、その可能性を感じます。
不完全情報とは、環境内の状態に関する情報が部分的にしか観測できない状況を言います(そのため「部分観測」とも呼びます)。ゲームの場合、麻雀・ポーカー・マスターマインドなど、相手の手牌・手札などが見えないゲームがこれに該当します。
不完全情報ゲームは、単純な探索だけでは攻略することは困難です。「隠された相手プレイヤーの状態を推定する」という高次のプロセスが必要だからです。
言い換えれば、不完全情報ゲームは、断片的に得られた情報を統合し、欠けた情報を補って意思決定する必要があるため、これを攻略する研究は、「どうすればより難しい問題を解けるか」という工学的な側面(How)だけでなく、「なぜ人間は隠された状態を推定し、その結果を判断に繋げられるのか」という理学的な側面(Why)も備えているのです。
そのため、「ゲーム」という題材は同じですが、将棋・囲碁などの研究の系譜とは、必ずしも一直線に繋がりません。
むしろ、実環境におけるロボット制御など(身近なところでは、ルンバの制御)の研究に近いと言えます。カメラやセンサから得られた情報は、環境全体を知覚した結果ではなく、その限られた一部を反映したものだからです。
不完全情報ゲームの難しさは、福本伸行の麻雀マンガ「アカギ」で分かりやすく表現されています。このマンガは、相手の機微を推測する心理描写に多くのページを割いています。
相手がどのような打ち方をするプレイヤーであり、いまどういう心理状態であるか、その場合、何を手牌に持っていて何を狙っているか……推定と判断の繰り返しが、知能を伴った人間のコミュニケーションの本質と言わんばかりのシーンが目白押しです。
例えば、下記に引用するシーンでは、相手プレイヤー(浦部)はアカギが一九字牌で役を組み立てている可能性が高いと推定し、「中」を捨てるのは危ないと判断した上で、リャンピンを捨てています(読みは外れていますが)。
もし、コンピュータがこのマンガのキャラクターと同じように推定・判断できるようになったとしたら、女の子の機微を理解できるのではないだろうか、そのときこそ「人工知能が人間より賢くなった」と言えるのではないだろうか……そんな気がしませんか。
***
そうした期待を寄せながら、次の日経新聞の記事を読めば複雑な気分になります。
ポーカーやマージャンにAI 最善手選択、腕前プロ並に
マイクロソフトは19年8月、4人がネットで対戦するマージャンでトップクラスの実力をもったAIを開発したと発表した。約33万人がプレーする日本の対戦サイトに参戦して5000回以上対局を重ね、そのときに12人が維持していた最高位の10段にAIとして初めて到達した(日本経済新聞, 2020年1月18日)
昨年、マイクロソフトの元ネタ発表を読んだときに、素直に驚いた後、激しくガッカリしたことを、最近この記事を読んで思い出しました。
まず、驚いたのは、ごく単純に「麻雀で人間と同レベルに到達した」という点に衝撃を受けたからです。本来見えない牌を盗み見するチートの実装を疑ったほどです(サードパーティのプラットフォームを利用しているらしいので、これはできないはず)。
麻雀でそのレベルに達したなら、コンピュータに攻略できないゲームは、もうほとんど残されていないと言っていいと思います。麻雀より複雑な不完全情報ゲームは……おそらく、それほど多くはないでしょうから。
日経新聞の記事で松原先生が「不完全情報ゲームで人間の能力を上回る段階にさしかかってきた」と素直なコメントを寄せているように、最難関の不完全情報ゲームをコンピュータが攻略したことには、私もストレートに驚きました。
次に、ガッカリしたのは、「隠された情報を推定する過程を明に実装していないらしい」という点に気づいたからでした。
つまり、マイクロソフトのプレスリリースを見る限り、何らかのメカニズムを組み込んで隠された情報を推定しているわけではなく、それは「分からない」まま形勢を評価し、意思決定させているらしいのです。
そのため、「なぜそれができるのか?」という理学的な疑問には答えられていません。「勝ちゃいいってモンじゃねえだろ…」というのが個人的な感想です。完全情報ゲームと研究の系譜を「探索」で揃えて意味があるのかと。
***
さて、「不完全な情報しか得られない環境で、コンピュータが人間のように理解・判断できるようになる日は来るか?」という冒頭の問いには、「分からない」としか言えません。
なぜなら、「なぜできるのか?」という疑問に対する普遍的な回答——つまり、特定の課題に特化しない推定と判断のメカニズムは、「知能」の本質に極めて近いと思うからです。
ただ、1つだけ確かに言えることは、そのプロセスが模倣できた時は、人間の知能に関する理解は相当進んでおり、コンピュータで可能になることも飛躍的に増えているだろうということです。
女の子の答えがポジティブでないことに気づけてしまう能力があると、時には辛いこともあるかもしれませんが、「私も好きだよ」と言ってもらうためにも、またこの能力は必要ですよね。
それが「人間的」ということであり、人間が「知能」という深淵に近づくということでもあるのでしょう。
====
・この記事を書いた藤田の Twitter は、こちら。
・本稿は、「面白い文章を書けるようにするクラブ」のレビュアの皆さまからアドバイスをいただいて執筆しました。ありがとうございます。
クラブ楽しいよ!レッツ・ジョイン!