いま「AI」と呼ばれているモノについてのおさらい(放送大学より)
前振り
「あれ、GPUをAIの研究に使えるんじゃね?」から始まったAI狂騒曲。約8年前に買ったNVIDIA(NVDA)はドル建てでは約83倍、円建てでは円安もあって約130倍になり予想外の資産価値増加に買った本人が驚いているのですが、「えーあい、えーあい」と言われているモノが自分が認識しているモノとは違ってて変なモヤモヤ感やぐにゃーとしか感情しかなく消化不良状態が続いていました。
それ以前にプログラミングを覚え始めた頃に第何次AIブームがあったのですが、漠然と「AIってIF文の塊なんじゃないの?」なんて思ったりもしました(今でもこの考えを引きずっていますが)。
そのようなときに2024年5月8(水)に放送大学で『数理・データサイエンス・AI リテラシー講座 「導入 第6回 データ・AI利活用のための技術 2」』という講義が放送され、その中で現在AIと呼ばれているモノは本当にAIなのか、現在AIと呼ばれているモノは何ができて何ができないかといったことが述べられており、非常にスッキリしました。
この講座は2021年4月に開設された講座でそのときのものが放送されていると思うのですが、この講座で述べられていることと現状を自分なりに比較して「大きなブレークスルーもなく何も変わってないじゃん」と思いました。
「10年前にNVIDIA(NVDA)を買っていれば」と「たられば」を言うのもいいですが、盲目的にAI賛美している現状はどうなのかね、「AI」とつけておけば売れるのかね(昔米国で会社名に「エレクトロニクス」や「トロン」がついて入れば株価が上がったのと同じ状況では?)、そもそもAIを神のようにあがめている人々はこの放送大学で述べられていることを知っていて彼らにとって都合の悪いことは隠して金儲けしているだけじゃないの?なんてことを思ったものですから、NVIDIA(NVDA)ホルダーながらこの講座の冒頭部分(3パートあるうちの1番目のパート)の文字起こししたものとキャプチャーしたものをnoteに貼り付けておこうと思いました(NVIDIA(NVDA)ホルダーにとっては不都合なことも述べられています)。
この講座を全部みたい方はAIで大きなブレークスルーでも起きない限り同じ講座が放送されると思いますので、いつ放送されてもいいように録画予約しておくといいと思います(放送は誰でも無料で見られますので問題ありませんが、放送大学に入学してテキストも購入して単位を取ろうと思ったら入学手続きなどをしてください)。
またこれが著作権や「引用」の範囲を超えているかどうか判断できてませんので、怒られたらサクッと削除になると思います。私が要点をまとめてnoteに書けばいいのでしょうが、私がまとめたものより講座で述べられていていることをそのまま文字起こしなどをして載せたほうが私の脳内変換ミスもなくそのまま伝えられるのでそうしました。
それと今日のソフトバンクの株主総会で孫正義がAIについてあれこれ話すという記事を2,3日前に見たので、放送大学で言っていることと孫正義が言っていることを付き合わせてみるのも面白いかもしれません。ペッパー君はどのようなAIだったんですかね?あれを見て違和感を感じた人が沢山いたんじゃないかと勝手に思っているのですが、どう思いました?
と前振りも終わりましたので、以下に文字起こしとキャプチャーしたものを載せます。
放送大学テレビ 数理・データサイエンス・AI リテラシー講座 「導入 第6回 データ・AI利活用のための技術 2」
2024/05/08(水) 19:30~20:15
放送大学テレビ
数理・データサイエンス・AI リテラシー講座
「導入 第6回 データ・AI利活用のための技術 2」
※ここから
パート1はAIの現状、パート2はデータ可視化、そしてパート3はパターン認識という内容です。
AIの現状
それではパート1としまして、AIの現状から始めます。
AIが万能だと期待している方には、ちょっと残念な話題も入るかもしれません。最初のトピックは特化型AIと汎用AIという話です。
ご存じの通り、人工知能というものは我々の知能を人工的に作るものですので、その実現のためには我々の知能がいったいどういうものなのかをまず理解する必要があります。
我々の知能は実にいろいろなことをやっています。数学の問題を解くという知的な作業だけではなくて、ラーメンを食べて美味しいなと思ったり、ジョークを聞いて笑ったりとか、絵を描いたりとか、こういうのも全て我々の知能が行っているものです。
こういう様々な機能を持つ知能をたった一つのAIで実現しようとすると、かなり難しいんじゃないかと予想されます。そこで、現在の人工知能の主流は特化型AIと呼ばれるものです。
これは特定の知能だけを人工的に実現したAIのことです。
例えば、画像認識だけのためのAI、対話だけのためのAI、将棋だけのためのAIなどです。これらはそれぞれ別物として独立に作られたものなので、例えば画像認識AIで将棋はできませんし、天気予報AIで対話はできません。現在の主流はこの特化型AIなのですが、これが本当に何かを考えたり理解するような知能なのかということについては以前より批判があります。
最も有名な批判の一つに「中国語の部屋」と呼ばれるものがあります。
今、部屋の中に一人の人とルールブックが置いてあるとします。この人は中国語が全く分かりません。しかし、ルールブックを見ることだけはできます。そして、このルールブックには、どのような文章が来たら、どのように返事をしなさいということだけが書いてあるとします。
今、この部屋の外側にいる人からある質問が来たとします。例えば、こんな感じで「日本の首都はどこでしょう?」という質問が中国語できたとします。そうすると中の人はルールブックを開きまして、これと同じ文章をまず見つけて、次にルールブックに従って「東京です」と中国語で返します。
ここで大事なことは、この人はこれらの文章の意味は全く分かっておらず、ルールブックに従って機械的に返しただけという点です。それだけですが、この部屋の外にいる人から見ると、この部屋は中国語を理解する知能を持っているように見えるということです。
しかし、これは残念ながら何かを考えたり理解するような知能ではありません。現在利用されているAIという技術は、ほとんどがこの特化型AIですので、残念ですが真の知能じゃないと言われてもしょうがないようなものばかりということになります。
このため、特化型AIは弱いAIとも呼ばれています。弱いAIに対して強いAIもあります。
それが汎用AIと呼ばれるものです。汎用AIとは、我々の知能と同じような柔軟さと多機能性を持つものです。ジョークを聞いても面白いと思うし、対話もできるという何でもできるAIです。
まさに知能という感じがします。しかし、残念ながら現状ではまだ研究段階で皆さんの身の回りにはありません。ただ、こういう風にすればできるんじゃないかという方法がありまして、それはここに示した「全脳シミュレーション」と呼ばれるものです。シミュレーションという言葉、ご存知の方も多いと思いますけども、まさに我々の脳の構造を真似してコンピューター上に作ろうというものです。
そのために脳を構成する一つ一つの神経細胞の動きを再現し、さらにそれらをまとめた脳全体の構造も再現する必要があります。これができれば強いAIができると期待されているんですけども、現状ではまだ完成品と呼ばれるようなものはありません。
AIとビッグデータ
第2のトピックとして、AIとビッグデータについて述べたいと思います。ビックデータというのは大規模なデータのことです。
最近のAIの学習には、このビッグデータが欠かせないと言われています。ここで学習というのは、AIが思った通りに動くように賢くするプロセスのことです。
例えば、画像認識の学習では、この絵にありますように、ひまわりの画像を与えると、ちゃんとそれをひまわりと答えるようにAIを作り込むということになります。最近のAIの多くは深層ニューラルネットワークというもので実現されています。このニューラルネットワークが機能するためには、例えばひまわりの画像に対してちゃんとひまわりと答え、犬の画像が入ったら犬だと答えるようにする必要があります。
この深層ニューラルネットワークの正体は、簡単に言えば皆さんご存知の掛け算や足し算などの演算です。入ってきた画像データに対して数億個の数を掛けたり足したりすることで、最終的にひまわりという答えが出てくるのです。問題は、これらの数を適切に調整しておかないと、正しくひまわりとは答えてくれないという点です。
そこで、大量の画像データを用いて試行錯誤的に調整を行っていくのです。1例ですが、1,000種類の画像を認識するAIのためには、120万枚もの画像が準備されました。なかなか一人で集めるには大変な量ですが、それぐらいないと数億個もの数を適切に設定できないというわけです。
実はもっと大変なのは、単にデータを集めただけでは不十分という点です。この画像をちゃんとひまわりと答えなさいと数を調整するためには、この画像がひまわりであるという正解が分かっている必要があります。先程の例のように120万枚もの画像があったとしますと、それら全てについてこれは犬の画像これは猫の画像という正解も別途情報として誰かが与えないといけないということになります。
これは結構大変な作業です。画像認識AIを作る場合は、正解として各画像に何が写っているかという情報が必要です。翻訳AIの場合は、ある原文に対して、それに対して正しい翻訳結果はどういうものであるかというのが大量に準備されている必要があります。
対話AIの場合は、ある言葉を投げかけられたら、それに対してこう返事をするべきだという正解が必要になります。
今のAIにできることできないこと
それでは最後のトピックとして、今のAIでできることとできないことについて説明したいと思います。
第1は、敵対的事例の存在です。敵対的事例というのは、簡単に言いますとAIにとって意地悪な入力です。この右側の絵を見てください。ノイズに汚れてしまってますが、皆さんにはそれでも「A」に読めると思います。
ところがこれはAIに意地悪をするための特殊なノイズでして、実際にAIにこれを認識させますと自信満々に「B」と認識してしまうのです。我々人間はこのノイズのようなものはいらないものだという常識がありますので、ノイズを自動的に無視して「A」と正しく認識します。
しかし、AIにはそういう常識がないのです。ノイズはいらないものだということを学ばせない限り、何に間違ってしまうか分からないというわけです。このように、習っていないものについては融通が利かないという難しさがあります。
次に、フレーム問題について述べたいと思います。
これも先程の話とちょっと似ているのですが、現在のAIは特定の範囲のことしか考えが及ばないと言う問題です。今、AIを搭載したロボットに「向こうの部屋にある台車に乗った段ボールがあるからここまで持ってきてくれ」と命令したとします。
そうするとAIロボットは忠実に命令を実行しまして、台車を運んでくるわけですが、実はその上の荷物には爆弾が乗っていたとします。そうするとそのまま持ってくると目の前で爆発してしまいます。一方、我々人間は絶対にこんなことはしないわけです。
もし爆弾が乗っていたら、取り除いた上でこちらに持ってくるはずです。
しかし、AIは特定範囲のことしか考えられず、範囲外にあることに対しては失敗してしまうのです。これをフレーム問題と呼びます。もちろん、爆弾があったら捨てなさいとか、水の入ったコップが乗っていたらよけてから荷物を運びなさいとか、様々な例を予め教えておくことは可能です。
しかし、ちょっと考えれば分かりますが、そういう例というのはキリがありません。で、結局ある程度の範囲のことしかできないということになります。人間も同じような問題を持っているはずですが、どう回避しながら日々生きているかは、実はまだ分かっていないのです。
最後に、判断根拠が不明確と呼ばれる問題があります。
現在、医療画像を見て手術が必要かどうかを判断するAIが実用化されつつあります。さて、もし皆さんのCT画像を見たAIが手術が必要だと判断したとしましょう。
すると皆さんはなぜ手術が必要なんですか?ときっと聞きたくなると思います。ところが、現在のAIは「こういう理由だから、あなたは手術が必要だと判定しました」という説明ができないのです。手術の必要性については正確に判断できても、なぜその判断を出したのかが説明できないというわけです。
これについては、現在様々な研究がなされており、技術も進歩していますけども、まだ絶対に大丈夫というような説明はできていないというのが現状です。
現在のAIは全く万能ではない!
パート1ではAIの現状についてお話してきました。実現できているのは、画像認識だけ、対話だけ、将棋だけといった特化型AIです。また、十分なデータがなければAIは正しく動かないのですが、データの収集には限界があります。例えば、プライバシーに関わるデータを集めることは困難ですし、大地震などの貴重なデータを大量に収集することはほぼ不可能です。
また、敵対的事例やフレーム問題、判断の根拠が不明確であるなど、多くの問題を抱えていることも見てきました。現在のAIでできることとできないことを理解しながら、AIが役立つところでは適切に利用することが重要です。
※ここまで
余談
この講座を見たあと、ビッグデータのためにインターネットで公開されている情報をかき集めたけどほぼ漁り尽くしてしまったので、さらにデータを追加するにはどうすればいいのだろうとビッグデータ集めが行き詰まっているという記事を見ました。
そうなるとインターネットに公開されてない書籍や絵画、もっと広げて動物や植物、さらに広げて森羅万象についてコンピューターが認識できる形で与えなければいけないと思うのですが、それって可能なの?と思ってしまいます。
誰もが思いつかないような事を思いつき、それを実現できるような人でも現れない限り、いま騒がれているAIというものはまもなく行き詰まるか、既に行き詰まっているのかもしれません。
そしてNVIDIA(NVDA)のGPUはニュースなんかを見ると特化型AIに使われており、GAFAMがAIに参入とか雨後の竹の子よろしくAIに関する企業が誕生していますが、それらもニュースを見る限り特化型AIの企業のように見えます。
汎用AIを作るに当たって特化型AIから使える技術や学べることがどのくらいあるのか私の頭が悪いのとアンテナの張り方が悪いのかサッパリ分かりませんし、そもそもニュースや新聞、コンピューター関係の雑誌から特化型AIや汎用AIというキーワードを見たことがありません(記事を書いている人達が知っているかどうかも分かりません)。
とりあえず今のところは放送大学の講座で学んだことをベースにして、ニュースなどを見ながら「あー、これは特化型AIのようだから真の知能じゃないね」なんて評論家面しつつ「いつ頃NVIDIA(NVDA)をオモチャにして遊ぶのをやめるのかなー」なんて思いながら昼寝をしたりアニメを見ていようと思います。
2024年6月21日 午後9時頃追記:ソフトバンク株主総会で飛び出した「人工超知能(ASI)」について
ソフトバンクの株主総会で「人工超知能(ASI)」なんてキーワードを言ったという記事を見てASIについてぐぐってみたけどソフトバンクの公式ページや株主総会の記事しかヒットしなくて誰もASIについて知らなかったんじゃないかと(私も知らなかった)。
ちなみにWikipediaで人工超知能について調べると「超知能」のページに飛ばされ、コンピューターと脳をつなげるといったことが書かれてて士郎正宗のマンガ「アップルシード」や「攻殻機動隊」、SF小説「ハードワイヤード」の世界が展開されていたり、優生学上等や映画「ガタカ」のデザイナーズチャイルド(映画の中では今まで通り自然にまかせて産んだ子は「神の子」と呼ばれている)といった話が展開されていたり、「生物のニューロンは約200ヘルツをピーク速度として動作している。この数値は、現代のマイクロプロセッサ(ピーク速度2ギガヘルツ)と比較すると7桁も遅い。」なんて言っているスペック厨がいたりして(7桁遅いのに人間が知能を有しているのはスペックとは違う部分が大きく影響しているんじゃないの?そのことに気づかないの?)、とにかくSF大好きっ子がいるんだなーと思いました。
当の孫正義はLINEヤフーのことも含めて都合の悪いことは一切触れないしゃべらなくて孫正義だなーと思いました。ソフトバンクの株主は孫正義のAI独演会についてこれらのツッコミを入れても良さそうだけど、Xで自社株買いを否定されて株価が下がったというポストを見て、もう誰も孫正義の寝言に耳を傾ける人はいなくて目先の株価しか見てないんだなーと思いました(いまさら感いっぱいだけど)。
10年前にNVIDIA(NVDA)を買って持ち続けた結果、日本円で200倍以上になったというXのポストを見たけど、ソフトバンクだったらどうなのかとチャートを見たら2.5倍くらいにしかなっておらず、AI革命とやらの投資先としてソフトバンクはハズレの方だったようです。
超知能(Wikipedia)
汎用人工知能による実存的リスク(Existential risk from artificial general intelligence:英語のページしかないのでGoogle Chromeなら右クリックから「日本語に翻訳」で読んで)
ちなみに「ロボット」という言葉を生み出したカレル・チャペック の戯曲「ロボット(R.U.R:ロッサム万能ロボット会社)」は1920年の作品なので、それよりずっと前から「不安だよー、不安だよー」と言っていた人がいて想像力いっぱいの人がたくさんいるんだなーと思いました。