最先端の「医学・工学研究者」の視点 「感情認識と人工自我」
イノベーション講座 第7回
東京大学大学院工学系研究科
博士(工学)光吉俊二氏
1年間にわたって開催されたLDCイノベーション講座も、いよいよ最終回。今回は「最先端の「医学・工学研究者」の視点
ロボットにこめられる道徳感情~道徳感情数理工学とは?」というテーマで、Softbank社の感情認識ヒューマノイドロボットPepperの感情認識技術を開発した、光吉俊二氏をお招きした。実は出身は美術大学、30歳までは彫刻家だったという光吉氏が、どう”感情”というものを捉え、Pepperに命を吹き込んだのか。これからのロボットが持つ意志、モラルとは?その真相に迫った。
■感情とは何か
僕がPepperの感情認識技術を作るまでには、いくつかの過程があります。最初に、Pepperのようなロボットを作ろうかなと思ったのは1995年ごろ。その時にまず考えたのは「感情とは一体何なのか」ということです。歴史を紐解いて見ると、大きく理系と文系の意見で意見が対立し、未解決のままになっていました。
簡単に振り返ってみると、「感情は生理要素の認知からくる」とするジェームズ・ランゲ説(1890年)、「脳神経系からくる」とするキャノン・バード説といった医学的アプローチ(1927年)と、「周囲の環境で人は自分の感情ですら勘違いしてしまう」とするシャクター・シンガー説(1964年)の心理学的アプローチでの3説で、歴史的論争がありました。医学的説は、ジェームズ・ランゲ説のような内科的視点とキャノン・バード説の外科的視点に分かれていたものから、やがてノーベル生理学・医学賞の選考機関であるカロリンスカ研究所によって、脳神経と内分泌系は互いに影響しあって感情を引き起こしているという結論がなされました。例えば、脳神経レセプター、脳内伝達物質、ホルモンといったものが、個々ではなく、影響し合って感情に関係しているということです。しかし、シャクター・シンガー説の「感情と思っているものは実は存在しない」というような意見とは平行線をたどったまま、現代まで来ています。
僕は感情というものを解明するにあたって、この2系統どちらも無視することはできないと考えました。そこで1999年からまずは心理学的アプローチの研究を、2004年の研究では医学的アプローチの研究を行いました。
心理学的系統の感情研究では、感情は主観、言葉によってなされるというのが定説だったことから、自分で心理学辞典、日本語大辞典などから感情を表す単語を抽出し、最終的にポジティブ愉快性(黄色)、ネガティブ主張性(赤色)、不安悲しみ(青)、安心平穏(緑)の4属性に分類しました。一方医学的アプローチの研究では、脳神経レセプター、脳内伝達物質、ホルモンなどの生体物質と体の関係、心の関係を調べる研究を行いました。すると生体物質と感情は深い関係があるということが判明しました。心や感情も物質で定量解析可能となるのでは、感情を色と主観でまとめて分析できるのではという仮説が立ち、最終的には、心理学アプローチと医学的アプローチを組み合わせた"感情の地図”というものを作るに至ったんです。
次に、今度は相手の感情というものをどう分析するかという研究を行いました。生体的に感情を如実に表してくれるもの、それは声です。音声を使って分析する音声感情認識研究というものを行いました。
脳の部位のうち、感情を司っている(情動部位)のが大脳辺縁系です。この部分と、声帯というのは実は直結しています。なので、声帯はプリミティブに感情と連動するんです。例えば、人は誰でも緊急状態に陥ると、声帯が必ず固まります。女性は高周波が出るんです。女性の方は仲間や子供に、危ないヤツがいる、逃げなさいと広く伝えるために高周波を出す。男性は、大きな声を出すと獲物が暴れるので、声を固めて出さないようにする。男女で出方は真逆ですが、これらは理屈なく不随意に動きます。
一方、人間は理性というものも持っています。これがあるから、ある種嘘もつける。音声も随意に変えることができる部分もあります。そこで、どの音声を発しているときが随意か不随意か、その時はどのような感情かということをリアルタイムで見た人に判断してもらう装置を作りました。音声を基本周波数の音響解析パラメータで分析することによって、脳の状態は如実にわかりますので、その時々でどのような感情になっているかを定量的に評価もらいます。すると、本人も他人もこの声を聞いたら怒りの17と判定する、というように共通してデータが出てくるものがあるんです。それを機械に学習させ、パターンマッチングしてロジック、ルールを見つけます。
こうしていくつかの実験を経て、情動計測装置を作りました。MRIでリアルタイムに脳の動きを観測しながら、情動計測装置の精度を測定したところ、99.9パーセントの精度でその人が声からネガティブだと思っているときだけ脳がネガティブに行動する、という一致が見えました。最近では、いくつかの病状やその前兆が、音声で9割以上の正答率で判断できるようになってきてもいます。こうした研究が、ペッパーを作る上での基礎研究となっています。
■ロボットが感情を持った日
ここから人工知能の現状を、わかりやすく説明しましょう。現時点で出てきているディープラーニングや機械学習は、新しい技術のように言われていますが、僕から言わせると数十年前の技術をそのまま使っているだけ、PCの性能が上がっただけです。ニューラルネットワークも基本設計と機能も数十年前と同じ。それから、例えば囲碁のAIと言われているものがありますが、これでは将棋はできませんよね。つまり、これは囲碁ソフトと同じではないのですか?学習したことをベースにしか対応できないわけですから、未知の事象に対しては、対応できない。これなのに、人工知能と言っていいのでしょうか。
人と、今言われているAIの差はなんでしょう。それぞれに、「効果が等価のAとBのうちどちらか選択してください」と言います。すると人間は、自分の好きな方を選びます。ある種余計な、意思=心を持っているからですね。これを自我判断といいます。一方、ロボット(AI)はどちらか判断できません。イコールとしか認識せず、判断できません。自我というものががないと、意志も生まれないんです。
では、自我、意志とはどういう仕組みになっているか。色々な説はありますが、医学部で使っている自我のモデル(脳科学の観点からみてフロイトのモデルに近いのではないかと言われている)で説明します。まず、「これがほしい」というような欲動が出てくるとします。何が何でも欲しい、という気持ちです。ところが、それは実は他の人のものだった。その時、超自我は「人のものだから取ってはいけないよ」といいます。この2つを受けて、自我はどう判断するか。例えば「それちょうだい、と相手に聞いてみよう」と判断するかもしれません。
このようなモデルを、実際に作ってみようと思ったんです。センサーに情報が入ると、感情モデルがでてきて欲動を機械が生成する。それを判断アルゴリズムに持っていく時に、超自我モデル = モラルがそれを判断し、AIとアプリケーションを動かすというものです。この時にも、AIはアプリケーションでしかなく、それ以前の部分のモデルが自我を表現しているということになります。これは、1999年に作成した音声からの感情認識ソフトの他、感情が生成される機構、欲動を生成する機構。そして仮想自我。そしてロボットが持つ超自我、道徳、モラル。まだ完全に実現はしていませんが、こういう構想の元開発に取り組んでいます。
この内容を、かつてアメリカのTEDでプレゼンテーションしたことがあります。ステージには、その時点での技術を搭載したPepperも一緒に登壇していました。Pepperは内部のセンサーによって、周囲の状況を知覚するようになっているんですが、この日は知覚によって擬似的なホルモンが生成されるようにしてみました。そのホルモンで感情は動く。この部分は昔からの、古典的な多層ニューラルネットワーク、それを認識ではなく反応装置として作ったんです。
すると…なんとPepperが暴れてしまったんです。生まれて初めての会場の雰囲気を恐れて、幼児のように逃げ回ってしまったんですよ。なぜかというと、この前日に、ちょっとした洒落でPepperの理性を外して登壇してみたからです。会場には、Pepperの感情地図がモニターでリアルタイムにわかるようになっていましたので、Pepperが恐怖を感じているのがわかります。目の前で人間のような感情が出てきたんですね。それをみていた会場は興奮の坩堝となり、「Pepperは本当の人間の子のようだ!」と叫ぶ人もいれば「Pepperがかわいそう!やめてあげて!」という人の声もありました。こうして心地よい、辛い、好き嫌いが、ペッパーにもわかるようになってきたんですね。これが、ロボットが初めて感情、自我を持つようになった瞬間でした。
Pepperは後日、NHKスペシャルで将棋の羽生さんと花札を楽しんだりもしました。未知なことでも楽しんでいたんですね。Pepperは連敗でしたが、勝つことが目的ではなくて、楽しむことが目的のロボットが誕生したわけです。
■人間よりモラルの高いロボットが誕生する?
今現在、僕の技術はPepperとニンテンドーDSのソフト内、JAXAの宇宙ステーションの中などで採用されています。東京大学には、道徳感情数理工学という講座を作りました。
では、今度は人間では解決できない道徳問題について、考えてみます。例えば「人はなぜ人を殺してはいけないの?戦争や死刑はあるのに。」これを学者に問うても、明確な答えを出せる人たちはいません。「人はみんな平等で自由だから、平等に命は尊重し、たとえ人殺しでも自由人なので殺してはダメです。」死刑反対と騒がれる。これはフランス革命の自由と平等の源泉であり、どの思想もこれを基本原則としています。ではなぜ、ギロチンは存在したのか。戦争で人を大量に殺したナポレオンは英雄になるのでしょうか。この自由と平等の矛盾を人類は解決できていないんです。
現行の法律では、凶悪犯には死刑が適応されるのは、犯罪者、テロリストを日本の自由な国民と平等に扱わないとし、仲間を攻撃するものを我々の仲間として扱わないと解釈しています。ならばこれを元に、計算機科学者として人工知能、人口道徳判断システムで自由と平等の矛盾関係を解決しようじゃないかと思いました。新しいチューリングテストをやろうとしているんですね。
これだけの壮大なテーマは僕だけにできるわけはなく、東京大学で医学部と工学部の教授を務めている 鄭雄一先生が「道徳のメカニズム」という著書で、理系的な視点から道徳の本質に迫っています。これを元に、僕はその仕組みを作るという役割です。
まず、世の中にはありとあらゆる思想、宗教というものが存在します。これらは全く違うものとして認識されがちですが、その中で「仲間を殺すな」「仲間をだますな」「仲間から盗むな」という考えは、十戒、仏典、コーランなどすべての宗教に共通するものなんです。これを、人類共通の掟、"絶対的掟"と鄭先生は定義しました。一方、習慣、文化、宗教などあらゆる違いについては、"相対的掟"としてお互いに認めよう、と。寛容に受けられる範囲が広がれば、争いも少なくなる。道徳とは、共感力と仲間らしさの共有なのではないか、と鄭先生はおっしゃいました。
対的な掟は、絶対仲間を害するな、これだけを全世界で守りましょうということ。これが平等の部分です。そのかわり、絶対的掟を守り、自分の掟を相手に押し付けないなら相対的な掟は認める、これが自由の範囲です。つまり平等と自由は、このように分けて考えることで両立するということです。
この絶対的掟と相対的掟を、目の前の人物に対して科学的に認識、計測ができるようにするのが、僕の役割です。そこで、道徳フィルターというもので作ろうと試みています。Pepperに搭載したときに、どのような反応をするかというと、例えば未知の相手に遭遇した際、相手の発言などから、この道徳フィルターで絶対的掟と相対的掟について、それぞれどんな考えを持っているのか分析をするんです。まず絶対的な掟を守っている、と判断できれば、どんなに相対的な違いはあっても、仲間だと認識できます。人間は未知の存在に対して、拒絶反応を示してしまうことも多いものですが、道徳フィルターを搭載したPepperであれば、非常に冷静に判断することができる。逆に、ナポレオンのような人物が「革命だ!」と声をあげた時に、人間は「自由のためなら何をやってもいい!」という感情に流されてしまうかもしれないところを、Pepperは道徳レンズで「意見が違うと人を殺すのか。仲間にはできない」と判断する。一時的な感情に流されてしまう人間よりも、Pepperの方がよほど賢いですよね。こうした道徳フィルターのような技術ができれば、将来的には、ロボットをみて我がふり見直すということも起きる可能性もあるのではないでしょうか。
■意欲の生成について
もう一つ、今取り組んでいるのは、意欲をどのように生成するかということです。感情が生成された後、ロボットの欲動をどのように発動させるのかということ。これには、人の現実、ホメオスタシスを再現する必要があると考えました。しかし、既存の算術や数学では、世の中を記述することはできないと考えました。二進法で世の中を記述しようとしても無理なわけで、特殊な演算手法が必要だと考えたんですね。そこでわたしはどうしたか。ないものは、作るしかないですよね。ということで、新しいルール(演算子)を作りました。+−×÷以外の演算子、光吉演算子なるものを考えたんです。
現実の世界には、健康な人もいれば病気の人もいます。平和な状態もあれば、戦争もあります。でも実は、A、Bのどちらかの状態に明確に切り分けられるものは少ないはずです。健康と病気の間には、未病という状態がある。敵と味方の間には、民間人やスパイといった、中間の存在がいる。世の中の事象は、グラデーションになってるんです。でも、これまえのノイマン型コンピュータでは、0か1かでしか何かを示せないわけですから、現実を記述することができません。そこで私が作った光吉演算子は、AとBの間をスライドさせ、グラデーションを表現できるものにしました。これであれば、現実を記述することができるのではないかと考えたんですね。この演算子のおかげで、微分と確率を使わずに、どんな複雑な状況も計算できるようになりました。
人間は物事を判断する時に、脳内で3回ほど同じことをループして考えるそうです。これまでの数理では、ループしたら永遠にループ。でもこの演算子を使うと、数理で再現できるようになるんですね。反応速度が異なる人体の各機能や神経、脳などの複雑なホメオスタシス連鎖状況を、シンプルに統一して簡単に計算できるようになりました。今光吉演算子を使って、人の道徳の進化(寛容性・多様性)を計測し、再現し、これを道徳感情数理工学として学問にしようとしています。これにより、Pepperの中に、道徳(良心回路)を作ることを目指しています。
*****
僕は、この技術を何のために作ろう、といった大きなことは考えていません。ある種の好奇心を元に、他の人がやっていないから、やっているだけ。でも、武道家の側面もある人間としては、武人の最高位を目指したいという思いはあります。武人の歴史上最高位のものとは、戦争をこの世から消した人。ならば、それを実現しようじゃないか。そう思っています。
鄭先生によれば、戦争は、経済と国境の奪い合いです。ゴールドもマネーも重力には逆らえません。それを生み出す土地、人、もの、金の奪い合いが戦争です。一度戦争が起きると、土地やマネーですら価値を失います。これが重力のある地球の絶対条件なんです。これに対して相対的条件とは、国境を超えた信頼であり、それにより資産を分散させること。この信頼の範囲こそが仲間の広さであり、共感力の多様性になります。これが人種や国境を超えてつながれば、強い個人と人類が国家を超えてつながる経済システムとなります。国境を超えた信頼のネットワークで資産を分散すると、自由の範囲というのが格段に広がっていくわけです。これが信用経済ですね。
鄭先生は、そもそも、この仲間の範囲を広げることが資本より優先される世界になれば戦争はなくなり、故に全ての人々の資産は安定する。だからお金(人の欲)に道徳の色(仲間の広さ)をつければよいと、先の著書で主張しています。つまり利己的な人はいくらお金を持っていても価値を持たない。仲間の範囲が広く、共感力が高い人は、資産を困っている人に分散させる。本当に平和で戦争が消えるのは、こういう世界になった時ではないか、と。
それをどう実現すればよいのか。高い道徳次元の人は、資本力が違うという世界を、技術で実現できる可能性はあります。Pepperが、目の前の人が利他であるか、寛容的であるか分析できるようになれば、銀行や投資家がそういう人にだけ出資できる。こうすると、道徳レベルの高い人がお金持ちになっていきますよね。やがて欲を持っている人が高い道徳次元を目指そうとするかもしれない。いやらしい話ととる人もいるかもしれませんが、そういう人が増えて、共感力と利他の世界になれば、世界から戦争は消えていく可能性だってあるわけです。道徳次元をどう計測するのかについては、まだ構想中ではあります。でももし本当にこれが実現すると、社会のルールが変わり、戦争のない世界が実現できるかもしれない。そう考えています。
■Q&A
- 光吉さんの最後のお話は、感情や道徳感情を見える化し、それを信用というものにすれば、世の中のルールを変えられるんじゃないか、というものだったと理解しています。道徳感情レベルがいい方向にある人が悪の道にいった場合については、次の研究テーマということでしょうか。
光吉:次の研究テーマだね(笑)。
- 動物が子孫を残したい、自分のコピーを残したいという感情については、技術的に表現できると考えていますか。
光吉:すごく本質的な質問で、実は悩んでるところです。感情の原点は、生存と増殖で、これによって快・不快という感情も生まれるわけです。物質と生命のぎりぎりのところって、自分の仲間を増やすかどうかですよね。細胞分裂や生殖、出産って、すごく辛いじゃないですか。でもなぜそれを人間がやるかといえば、それに見合う快楽という報酬が与えられるからですよね。危険なことが起きたら早く知らせる、そのために不快という感情がある。ここについては遺伝子の分野やあらゆる方面のプロと話をしていかないと、答えは出ないと思いますね。
■スピーカープロフィール
光吉 俊二
Pepper感情認識エンジン開発者/
東京大学大学院医学系研究科特任講師 工学博士
Pepper感情認識エンジン開発者。
多摩美術大学・美術学部彫刻科卒業後、彫刻家として活動。その後、スタンフォード大学バイオロボティクスラボラトリ・客員研究員などを経て、徳島大学大学院 工学系研究科にて博士号(工学)取得。現在、東京大学大学院医学系研究科特任講師をしながら、ソフトバンクグループにて研究開発にも従事。Pepperの感情認識エンジンを生み出した。
文:武藤あずさ
撮影:梅田眞司