ドラえもんの心の作り方: 超AIをついに開発!日本発の「ドラえもん的発想」が世界を変えるブレークスルーを起こす(ダイジェスト版)
1. ドラえもんの心のつくり方 読書レビュー概要:
ここ数年来、私たちの生活はリモートやオンラインで激変しつつあります。特に、AIやロボと呼ばれる最新技術が毎日の職場や生活に入り込んできて、ますます頭の中は混乱しています。
そんな中、ついにGAFAMを凌駕するAI技術が日本から生まれるかもしれないという話題が飛び込んできました。なんと、ドラえもんの心を持ったAIが「のび太な」私たちを助けてくれる日が、もうすぐ来るかもしれません。
ドラえもんのように、私たちと普通に会話できるAIの誕生間近となってきたのです。
2. この本のメッセージ:
ついに日本からドラえもんの心を持ったAIが登場し、毎日の困った問題を解決する手伝いをしてくれる日が来るかもしれません。
近年のディープラーニングによるAIのブレークスルーは、人工知能の分野にめざましい発展をもたらしています。しかし著者は、ビックデータをいくら解析してもAIが人と自然な会話ができる日は訪れないと断言しています。
なぜならば、現在のAIには決定的な限界があるからです。このたった一つのことに気がつき、全く違ったアプローチを取れば、現在のAIにブレークスルーを起こし、われわれの仕事や生活をまったく変えてしまうのだと。
一体その秘密とは何でしょう。筆者は囲碁や将棋、画像認識や文章問題では人間を超える能力を発揮するAIが、なぜ、日常会話(自然な会話)できないのかその理由から解き明かします。
それは、AIにはドラえもんのような「心」が無いからだというのです。
本書の筆者である田方篤志氏は、心をAIに持たせることができれば、のび太とドラえもんのように自由に会話をはじめることができると言います。そして、「人の心を持ったAI」が日本発となって、幸せをもたらすブレークスルーを起こし、世界を大きく変えていくことになると・・・。
3. 筆者について
著者の田方篤志は、特許事務所に勤めるサラリーマンから32才で独立し、個人ビジネスをはじめます。そこで大成功して43才でアーリーリタイアします。そして若かりしころの夢を実現するため、ビジネスで生まれた収益を研究開発に回し、20年以上、続けてきました。
ロボマインド・プロジェクトを始めたのは、言葉の意味理解の画期的なアイデアを思いついたからです。誰もやったことのない研究には、日本では、誰もお金を出してくれません。手軽に成果が出ることだけをしてたら、根本的に新しいものなど、作り出せなない。
まだ誰も気がついていない、画期的なプロジェクトから世界を変える会話ができるAIを開発するべく、現在、YouTubeや電子書籍などで発信しながら、AIに自然な会話を可能にするマインド・エンジンを意欲的に開発中です。
4. 誰がこの本を読むべきか
この本を読む関心度の高いのは、次のような人たちです。
●自分自身、ビジネス、私たちの日本経済にブレークスルーを起こそうという野心的な意欲を持った知的生産者の全ての人たち。
●ここしばらくのAI万能主義に対して懐疑的に感じていて、人間の可能性を拡張するためにAIはひれ伏すべきだと感じている人。
●日本の失われた30年という表現に怒りを感じていて、日本の優秀さがこれから再び実証されると信じている人。
これに加えて・・・
●AIや最新技術に全く新しい予想外のブレークスルーが起こる(あるいは起こらない)経緯を見届けようという、感度の高い知的探求者を自認するすべての人。
5. なぜ、この本を読むべきか、そのメリット、その理由は?
現在、AIはDXの流れとともに急速に普及が進んでいます。しかし、職場や生活がますますデジタル化され、何か大切なものが失われていくように感じるのも確かです。
本書を読むことにより、AIの本質を知りその限界を理解できます。 さらには、それを突破するブレイクスルーとなる技術がどのようなものかをよりよく知ることができます。
特に、AIが人と同じ心を持った時に可能となる、自然な会話がもたらすメリットとはどのようなものか、その可能性について理解することができます。
6. 本書の重要な構成:
なぜ、ロボットと人は会話ができないのか?
つい最近まで職場やショピングセンターなど目につくところにいたソフトバンクのペッパー君、最近は見かけなくなったと思いませんか?
実は、ソフトバンクはこの ロボットの生産を既に終了しており、人員も削減したり配置転換したりしているようです。このAIによるロボットは、発売当初は大変に話題になり、多くの企業が職場や接客の場に置くようになりました。
しかし私も感じているのですが、 この一見愛嬌がありそうなロボットは、実は、大変失礼で、少し会話をすれば、すぐにこちらのことを理解していない、会話が続かないと感じる代物でした。
全く役に立たない、無用の長物となって、結局のところその多くは廃棄処分となったようです。これに対して、長い年月を経ても愛されるロボットも確かに存在します。
ペッパー君に先立つこと20年、ソニーはAIBOと呼ばれる犬型のペットロボットを1999年に発売していました。こちらは、もちろん人間のように会話をすることはできませんが、ペッパー君とは対照的に人の感情をくすぐる愛くるしいロボットでした。
現在、第二世代となっていますが、生産終了となった第一世代は長く修理して愛用され、ついに修理のための部品が手に入らなくなった時には、所有者が合同葬儀まで行ったということです。
この2つを比較すると、一体何が違うのでしょうか。1つは、人から愛されるロボットとなり、もう一つは 人から敬遠されるロボットとなってしまいました。
この2つのロボットに共通しているのは、どちらも人の動きや言葉に対して反応することです。しかしAIBOが人の感情や心を癒すようにできているのに対して、ペッパーくんは全くの逆でした。
私もペッパー君との会話を数度は試したことがあります。しかし会話を始めようとするのですが、解答がチグハグで意思の疎通がうまくいかず、相手を困らせたり怒らせたりしてしまいます。結局、怒りを感じて二度と近づこうとは思いませんでした。
AIの限界: AIは人と自然な会話ができない
新井紀子著『AI vs. 教科書が読めない子供たち』を読んだことはありますでしょうか?人工知能が東大の入学試験に挑戦して受かるかどうかということで、大きな話題となりました。これは国の研究予算が与えられたプロジェクトです。当初の結論は、私立大学レベルは受かるが東大は無理というものでした。
しかし本当の目的はAIの能力を調べることで、「AIでなにができないかを調べること」だったそうです。そして究極的に導き出された結論は「今のAIは言葉の意味を理解できない」というものでした。
新井氏によれば、「コンピュータが扱えるのは、論理、確率、統計の3つだけだ」と断言しています。 「コンピューターに絶対できないこと、それは言葉の意味を理解することだ」というのです。
しかし、その後の2019年にグーグルのBARTというAIプロジェクトが文章の読解力テストで人間を打ち破ったというニュースが世界中を駆け巡りました。 また2020年には、イーロン・マスク氏も関係するOpenAIが開発したGPT-3というシステムでは、AIが作った文章は人間が作った文章と見分けがつかないまでになったと言われています。
これらは自然言語処理と呼ばれますが、 ディープラーニング(深層学習)を使って膨大な言葉のデータを統計的に計算して文章を作るものです。 これには人間の意思を反映したものではなく、実のところは言葉の意味を理解しているわけではありません。日常会話(自然な会話)はできないのです。
これが現在のAIの限界であり、コンピュータが人と自然な会話ができない理由でもあります。なるほど、ペッパー君に違和感を感じたのはこういった理由だったわけです。
ここにブレイクスルーを起こそうというのが、田方氏の「ロボマインド・プロジェクト」です。
ロボマインド・プロジェクトとは
田方氏がロボマインド・プロジェクトで目指しているのは、のび太とドラえもんがするような会話です。
もしこれができれば、AIが人間が考えていることをよりよく理解できるようになり、自然な会話を通して意思疎通をしてコミュニケーションの密度が格段に高くなります。
コンピュータが人間の言葉の意味を理解するようになるということは、人の感情(気持ち)を理解できるようになるということです。
これにより、 コンピューターと人間のインターフェース(UI)に飛躍的な進化が起こります。人とAIが自然な会話を通して、より基本的なことで意思疎通できるようになることで、コンピュータと人間との関係が全く違ったものになってくるのです。
AIがよりみじかで、日々の生活に役に立つ存在。まさしく、ドラえもんの世界がはじまるのです。
なぜ、日本からブレークスルーとなるようなAIが生まれてこないのか?
人工知能に関しては、日本も世界の最先端を走ってきたことに間違いはありません。
現在は第三次AIブームと呼ばれますが、1980年代の第二次ブームでは、まさにバブル期の真っ最中に、日本は世界中が注目するプロジェクトで全く同じようなAIを開発しようとしていました。しかしほとんど結果を残すことなく、プロジェクトは失敗に終わりました。
現在、第三次AIブームは欧米の後追いの形で進んでいます。このきっかけとなったのは、2012年トロント大学の研究チームが画像認識のコンテストでブレークスルーを起こしたことです。これが現在のAIブームを牽引しているディープラーニング(深層学習)です。
これに関連し、田方さんは日本の学術研究者が抱える深い問題を痛烈批判しています。先ほどのプロジェクトでも、国の予算を使って「AIで何ができないかを解明する」とし、結果として「今のAIは、言葉の意味が理解できない」ということが、改めて確認できたというのです。
国の予算をとるわけですから、何らかの研究成果を出さないといけません。 これでは 研究者は無難な研究をすることになり、どうしても外国で大きな成果が出た研究を少し変えただけの研究となってしまいます。
つまり、今まで誰も成功したことがない研究を同じやり方でやって、「AIには限界がありました」と結果報告すればよいのです。これで予算を獲得できます。
これが日本からイノベーションが生まれない闇の構造だというのです。手軽に成果が出ることだけをしてたら、根本的に新しいものなど、作り出せません。
田方さんがロボマインド・プロジェクトを始めたのは、言葉の意味理解の画期的なアイデアを思いついたからだと言います。このような誰もやったことのない研究には、日本では、誰もお金を出してくれません。
田方さんは、ご自身のビジネスで生まれた収益を研究開発に回すことで、プロジェクトを20年以上、続けてきました。これは本当にすごいことで、頭が下がる思いです。
ロボマインド・プロジェクトが目指すところ
コンピュータと自然な会話をするには意味理解が必要ですが、今のAIには言葉の意味を理解することがまだできていません。
例えば、「うれしい(歓喜)」とか「ありがどう(感謝)」といったことをコンピュータは理解することができないのです。こういった、人であればわずか3歳児でもできる、自分の意志や感情を言葉を通して表現して伝えることができません。
これほど基本的なことがなぜ見逃されてきたのか、田方さんはそこから切り込んでいきます。鍵となるのは「意味理解」「会話」そして「意識」です。これを定義してコンピュータのアルゴリズムとして実現できれば、次のようなブレークスルーを可能にすることができると言います。
ロボマインド・プロジェクトが目指す「2つのブレークスルー」
田方私が主催するロボマインドプロジェクトが目指すのは、次の2つのブレイクスルーです。
自然な会話
人工意識
このどちらも、ここ最近急速に進歩しているAIでもできないことです。 もしこれらが可能になれば、非常に大きなブレイクスルーが起こることに疑いの余地はありません。しかし、これは本当に可能なのでしょうか?
1つずつ見ていきましょう。
「自然な会話」をコンピュータで実現する
なぜ、AIは意味を理解できないのか
本書の特筆すべき点は、現在のAIの限界を明確にしていることです。現在のAIに何ができ、何ができないのか。そして、一体何をすればそこに未来の「ドラえもん」を開発し、私たちの相棒として迎えることができるのかを 語っている点です。
田方氏は、現在のAIの自然言語処理は、大量の文章から単語の数を数えて、どの単語の近くにどの単語が出現するか、と言う確率を延々と計算しているだけだと言います。AIが本当に言葉の意味を理解しているわけではないのです。
単語をビッグデータとして解析しても会話ができない。この根本的な間違いをおかしていることに、多くの研究者たちは気がついていません。
人間は複雑なルールを自然と処理しながら会話をしています。田方氏は、AIが人間と自然な会話ができないのは、「会話のルールと目的を理解していない」からだと言います。
ここが非常に重要なポイントです。田方氏はディープラーニングの本質を見抜くことが重要だといいます。ディープラーニングで1番重要なのは「特徴パターン」です。人間とディープラーニングが共通に持っているもの。それは、部分を組み立てて全体ができる、と言う世界です。
しかし、ディープラーニングは森の木を見ています。この一方で人間の認知は森全体を見ているのです。人間の認識する膨大な処理の中のほんの一部が、ディープラーニングがやっていることと一致した。巨大な森の中の一本の木、それがディープラーニングだと言うのです。
画像認識で人間の能力をこえる結果が得られたことにより、これまでにビックデータ神話が確立されました。ビックデータとAIさえあれば、全てを解決できると言う考え方です。
例えば、画像処理や文章の解析では、機械学習により人間よりもAIの方が高い認識率を達成しました。これは、ルールを教えなくても、AIが勝手にルールを学習したからです。しかし、これが成り立つのは、超単純なルールだからです。多くの研究者が、ここに間違いをおかしてしまいました。
なぜ、大量のデータがあっても会話ができないのか?
では、なぜ人間の能力を超えると言われる今のAIは、簡単な会話をすることができないのでしょう。
田方氏は、それは、大量のデータから1つの答えを導き出すのが今のAIだからだといいます。今のAIが苦手なのは、正解がないタイプの問題です。その典型が会話なのです。
いくら機械学習をしても、その答えが決まらないのです。 つまり、会話は機械学習できないのです。
AIが会話をするために必要なこと
さきほどの議論で、今のAIに会話ができないのは、それが正解ではないタイプの問題だからと言いました。しかし、入力に対して答えが決まらない場合でも機械学習できるものがあります。それはゲームです。
例えば、将棋ではある局面に対して、次の一手には様々な正解があります。しかし将棋や囲碁の世界では、すでにAIが人間を打ち負かしています。これはどうしてでしょう。
なぜ、ゲームではAIは人間を打ち負かすことができるのに、会話は3歳の子供にも勝てないのでしょう。
会話と将棋で比較します。この2つでは共通点と違う点があります。共通点は、正解が複数ある点です。違う点は、将棋には目的とルールが明確に決まっているということです。
将棋の目的は、もちろん敵の王将を取ることです。では会話の目的とは一体何でしょう?
会話にも目的のあるものと目的のないものがあります。目的のある会話は、質問タイプです。質問タイプの会話にはすでに今のAIで実現されています。医療業務などでも使われるエキスパート・システムなどがこれにあたります。
問題は、目的がないタイプの会話、日常会話、雑談などです。 今の自然言語処理は、ルールも目的も考えないで次に出てくる言葉の確率を計算しています。これに対して人間は、複雑なルールを自然と処理しながら会話をしています。
これまでの自然言語処理は、その50年の歴史で大きな勘違いをしていると田方氏はいいます。そこには根本的な勘違いがあります。それは、言葉の意味を言葉で定義しようとしている点です。
例えば「意味ネットワーク」と言うプロジェクトでは、 これまでにコンピュータに100万語の言葉の定義を教えてきました。これでも足りないということで、次は1億語を教えようとしています。
これは、常識をコンピューターに教えようとしているのと同じです。しかし、言葉を言葉で定義して教えた結果として、どれほど膨大な知識があろうとも、 知識をどのように使うのかがわからなければ、何の意味もないのです。
会話で必要なのは、知識や常識ではなくて目的です。自然言語処理が最も力を入れて解決すべきなのは、会話の目的なのです。
コンピュータが言葉を理解するとはどういうことか
今のAIに絶対にできないこと。それは、自然な会話。その違いは、ルールと目的が明確かどうかです。
コンピュータで文を意味理解する事は、まだ、誰にもできていません。意味理解の定義は、これまでに誰もやっていないのです。これを、ロボマインドプロジェクトは解き明かそうとしています。
田方氏は、人間は、意味を理解したりコミニュケーションに必要なものを、既に持っているといいます。それは何かと言うと、「心」です。コンピュータに言葉の意味を理解させるには、「人間と同じ心」を作ればいいのです。
具体的な事例で考えてみましょう。人が会話をする時、その目的は何かを伝えることです。ではこの「何か」とは一体何でしょう?
例えば「今日、学校でこんなことがあったよ」と子供がお母さんに話すとき、その伝えたい中身は何でしょう?
「今日、学校の給食でプリンが出たよ」そう、子供が言ってきたとき、何と答えてあげたらいいでしょう。
「学校給食が始まったのは、明治22年です」でしょうか?
そんなお母さんはどこにもいないでしょう。この時に、日本中のお母さんが答えたデータを全て集めて、正しい答えを統計的に計算しても何の意味もありません。
その子が聞きたい答えは、そういうものではありません。多分、こんな答えを聞きたかったのではないでしょうか。
「そう、プリンが出たの。よかったねぇ」
これであれば、子供が伝えたいことがしっかりと伝わっています。 子供が伝えたかったのは、プリンが出て嬉しかったということです。
「嬉しい」ことがあって、それをいち早くお母さんに伝えたかったのでしょう。それがしっかりと伝わって、「よかったね」と共感してもらい子供は安心します。
つまり、伝えたいこととは一言で言えば「感情」と言うわけです。「こんな楽しいことがあったよ」とか、「こんな悲しいことがあったよ」と言う感情です。 人は、感情が発生すると、それを人に伝えたいものなのです。単に、何か事実を伝えるということでは無いのです。
これで会話の目的は「感情」であることがわかりました。そしてもう一つ重要なポイントは、感情が行動と密接に結びついていることです。
プリングもらって「嬉しい」と言う感情が伝われば、笑顔になります。 学校の運動会で、徒競走のビリになれば「悲しい」と言う感情が発生して、 悔しがったり、泣きたくなるかもしれません。
「感情を発生して、それに基づいて行動する」これはまさに、「人間の心」そのものです。 この仕組みがわかれば、人間と同じ心を持って、人間と心を通わせることができるAIができる、と田方氏は言います。 これをプログラムに落とし込んでいけば良いのです。
意味理解の仕組み(アルゴリズム)
会話の目的は感情です。会話から感情さえ取り出せれば、AIでも雑談や日常会話が出来るようになる、と田方氏は言います。
さきほどの子供とお母さんの会話を図式化すると次のようになります。
太郎くんは学校で給食にプリンが出て「嬉しい」と感じました。 これは太郎君が頭の中で描いている「認知した世界」です。 これは、学校で給食にプリンが出たと言う光景の中に太郎君の「嬉しい」と言う感情が発生した場面です。
うれしかった太郎君は、早速家へ帰ってお母さんに伝えるわけです。「今日ね、学校でプリンが出たんだよ」 と。これは太郎くんの嬉しい感情を言葉に表したわけです。
この頭で思い描いている世界を「認知世界」と呼ぶことにします。 そして言葉で表す世界を「言語世界」と呼ぶことにします。
頭の中で感じた「認知世界」の感情を言葉にしたものが「言語世界」に投影されるわけです。これが最も基本的な、意味理解のアルゴリズムの図式です。
次に、お母さんの番です。「学校の給食でプリンが出たんだよ」って、言葉を聞いたお母さんは、頭の中で、学校でプリンが出ている光景を組み立てるわけです。
これがお母さんの認知世界です。言葉を認知世界に逆変換しています。
「そう、よかったねぇ」とお母さんは返します。
太郎くんは、それを聞いて、自分の嬉しい気持ちがお母さんに伝わったとわかって満足します。こうやって、自分の頭の中に発生した感情が、相手に伝わったかを確認しながら会話は進行していきます。
これに対して、AIが扱っているのは言語空間に限られます。 言語空間の中にある言葉のビックデータをいくら大量に、高速に計算をしても、自然な会話とならないことは、これでご理解いただけると思います。一番重要なのは、プリンが出て嬉しいと言う「感情」なのです。
重要なのは、「表面の言葉」ではなく、「頭で思う思い描いている中身」です。この「頭の中で思い描いている中身をコンピューターで再現」しようとしているのです。
コンピュータで意味理解を再現する
それでは、コンピュータで何ができれば、人間と同じように意味が理解できたと言えるのでしょうか。
会話の目的は「感情を伝える」ことです。会話から感情さえ取り出せれば、雑談や日常会話ができるようになります。 伝えたいのは感情です。
「感情を発生してそれに基づいて行動」する。これが「人間の心」です。つまり、「感情の発生→行動」の仕組み(アルゴリズム)がわかればAIと会話ができるのです。
田方氏はこれを「心理パターン」と呼ぶことにしました。
「感情」も「感謝」も、心の動きであり「心理パターン」です。人間の行動は「この心理パターン」で決まるのです。言い換えれば、人の言動の裏には、「心理パターン」が隠されていて、この心理パターンにもとづいて活動しているということです。
心理パターンには、恐怖、憧れ、嫉妬、今回、善悪など数十個から100個くらいあるといいます。
これまでの自然言語処理では、知識や常識を集め、これまで100万語以上をコンピュータに学習させてきました。 そしてまだ足りないと気づいて、今は1億語を目指していると言われています。
しかしこの心理パターンを使えば、わずか数十個のパターンを使ってコンピュータのプログラムに落とし込むことができるのです。これが意味理解のアルゴリズムです。
心理パターンの具体例
心理パターンの例をいくつか挙げてみましょう。
最も単純な心理パターンは「本能」です・・・
(続きはこちらから - 「本の棚」ブログの続きが表示されます。)
●残念ながら、この後のコンテンツは、noteの推奨文書量をはるかに超えてしまいます。続きは以下のリンクをクリックしてご覧ください。
本書の重要な構成(続き・・・)
・ロボマインド・プロジェクトが目指す2つのブレークスルー
(1)自然な会話
心理パターンの具体例
AIが言葉を理解して会話ができるようになる時
「人間と同じ知能」かを判定するチューリング・テストとは
(2)人工意識を作り出す
ロボマインド・プロジェクトの最終目的とは
意識の仮想世界説と人工意識
意識世界と言語世界がつながる時: マインドエンジンの誕生
マインド・エンジンの解説動画シリーズ紹介
7. 結論
お願い: この記事を読んだ感想を是非コメント欄からお寄せください。ありがとうございます。
このレビューを書いた人:
著者: デジタル読書のすすめ: 深層読書とナレッジベースがあなたの脳を覚醒する
関連:
参考
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?