AIの歴史と現在の問題
ジョン・ヘンリーの教訓
19世紀の都市伝説に「ジョン・ヘンリー」という人物がいます[1]。
彼は屈強な肉体労働者で、ハンマーを振るって岩に穴を開ける達人でした。ところが蒸気機関で動くドリルの登場により、彼は失業の危機に瀕します。そこで彼は、人間は機械よりも優れていることを示すために、穴開け競争で蒸気ドリルに戦いを挑んだというのです。
伝説によれば、ジョン・ヘンリーは(驚くべきことに)僅差で勝利を収めたとされています。しかし、あまりにも肉体を酷使したために、勝利の直後にその場で倒れて帰らぬ人になりました。周囲の野次馬たちは言いました。「彼は人間らしく死んだ」と。
この逸話から得られる教訓は何でしょうか?
「機械と競い合うのは命にかかわる」とか「バカバカしい」とかではないと私は思います。それはあまりにも表層的な解釈です。生成AIが躍進する現在、現代を生きる私たち一人ひとりが21世紀版のジョン・ヘンリーだといえるでしょう。この逸話からは、より深い教訓を得られると思うのです。
では、その教訓とは何なのか?
AIの歴史と将来を概観して、それを探りましょう。
AIの歴史
機械にヒトの行動を模倣・代替させる試みには、長い歴史があります[2]。早くも古代ローマやエジプト文明の時代には、身振り手振りで格言などを伝える動く彫像が存在したようです。1495年には、レオナルド・ダ・ヴィンチが手足の動くロボット騎士を設計しました。残されたスケッチから復元したところ、それは実際に機能したそうです。さらに、オートマタ(自動人形)の制作者では、18世紀に活躍した玩具職人ジャック・ド・ヴォーカンソンが有名です。彼は12曲を演奏できる等身大のフルート奏者の人形や、食べる・飲む・消化・排泄を行う『消化するアヒル』などの傑作を残しました。
1770年にヴォルフガング・フォン・ケンペレンが制作した『トルコ人』は特筆に値します。これはチェス盤の載ったキャビネットと、男性の上半身の人形が一体化した作品です。対局者が1手指すごとに、この人形はチェスの駒を掴み、動かし、頭を振って顔をしかめることまでできました。そして驚くべきことに、チェスの腕前もやたらと強かったというのです。
種明かしをすれば、『トルコ人』はキャビネットの中にチェスの名人が隠れて操作する、いわば手品でした。腕を動かすという物理的な行動は模倣できても、「チェスを指す」という知的な行動を模倣することは困難を極めたのです。
現代まで続くAIの歴史は、1956年に始まりました[3]。若き数学者ジョン・マッカーシーとマーヴィン・ミンスキーが、情報理論の創始者クロード・シャノンとIBM 701の設計者ナサニエル・ロチェスターを口説いて、ダートマス大学で夏季研究会を開催したのです。
彼らは「学習をはじめとする知能のあらゆる特徴のいかなる側面についても、正確に記述して機械にそれをシミュレーションさせることが理論上は可能という推測のもとに」研究を進め、「慎重に選ばれた科学者の一団が協力して一夏かけて取り組めば、こうした課題の少なくともいずれかには著しい前進をもたらせると考えて」いました。
言うまでもなく、それは楽観的すぎる見込みでした。
ひと夏どころか、半世紀以上も続くAI研究が始まったのです。
「AI」という言葉の誕生から、1970年頃までの時代を「第一次AIブーム」と呼びます。この時代には、とくに「探索と推論」を得意とするAIが研究されました[4]。たとえばチェスなら、電子計算機はヒトよりもはるかに高速に、ずっとたくさんの手を先読みできます。(時代は少し先に進みますが)1997年に当時のチェス王者ガルリ・カスパロフを破った「ディープブルー」は、このタイプのAIの到達点の1つでした。
1980年代は「第二次AIブーム」と呼ばれ、「エキスパート・システム」の研究が盛んになりました。人間の専門家(エキスパート)の思考や判断を詳細に書き出して、コンピューターにあらかじめプログラムしておけば、人間並みに賢いAIが作れるはずだ――。噛み砕いて言えば、これがエキスパート・システムの発想です。法律にかんする考えうる限りの質問と答えをあらかじめプログラムしておけば、「弁護士AI」を作れるだろうと考えられたのです。
実際には、この世界の知識には限りがなく、また同じ専門家同士でも判断が分かれる質問が無数にあります。そのため、エキスパート・システムという研究アプローチはやがて行き詰りました。
現在は、2012年頃から始まった「第三次AIブーム」の渦中です。その根幹となるのは、コンピューター自身にデータと答えを学習させる「機械学習」の技術、なかでも「ディープラーニング」と呼ばれる技術です。
ヒトの脳は、神経細胞(ニューロン)によってデータを処理しています。神経細胞同士は「シナプス」という部位をそれぞれ持ち、ネットワーク状に繋がっています。シナプスで化学物質を分泌することで、データを受け渡しています。よく使われるシナプスは感受性が高くなり(つまり情報伝達が速くなり)、一方、あまり使われないシナプスは感受性が低くなることが知られています。ヒトの脳がものごとを学習できるのは、このような神経細胞の仕組みによるものだと考えられています。
こうした神経細胞のネットワークを、コンピューター上でシミュレーションしたものが、「人工ニューラルネットワーク」です(※あくまでも神経細胞のシミュレーションであって、脳をシミュレーションしているわけではない。)。人工ニューロン同士の「結びつきの強さ」は、コンピューター上では数値によって表現されており、「重み」あるいは「パラメータ」と呼ばれます。
さらに、人工ニューラルネットワークは何層にも重ねることができます。ある入力に応じて人工ニューラルネットワークが出力したデータを、もう一段階深い(ディープな)階層の人工ニューラルネットワークへの入力として用いることができるのです。このような多層構造の人工ニューラルネットワークによる機械学習を、「ディープラーニング」と呼びます。
ディープラーニングによって、たとえば「写真に写っている物体がネコなのかイヌなのかを判断する」といったタスクをコンピューターでもこなせるようになりました。機械学習の誕生以前には、これはコンピューターにとって極めて難しいタスクでした。コンピューターは人間のように「画像」を⾒ているわけではなく、実際にはその画像データを構成するRGB値のような数値列のデータを処理しているにすぎないからです。また、コンピューターはネコやイヌのことを(ヒトが知っているようには)知っているわけでもありません。
ネコには個体差があり、1匹として同じネコはいません。耳の大きさや手足の長さ、毛の模様など、1匹ごとに少しずつ違います。さらに同じ個体のネコを撮影した写真であっても、ポーズやアングルが変われば、その画像を構成するRGB値などの数値列は変わってしまいます。しかし、目の前に10枚のネコの写真を並べられたとして、そのすべてが違うネコであっても、私たちヒトは「ネコの写真だ」と認識できます。イヌの写真と区別できます。これは、ヒトの脳がネコの「特徴」を覚えているからです。
ディープラーニングを用いることで、コンピューターにも画像や映像、音楽などの「特徴」を覚えさせることが可能になりました。それまでのAIに比べて、これは驚異的な進歩でした。
2014年頃になると、人工知能の危険性に警鐘を鳴らす人々も現れました。たとえばMITの理論物理学者マックス・テグマークを中心に、AIの安全性研究を行う「FLI(Future of Life Institute)」が結成されました[5]。また、オックスフォード大学の哲学者ニック・ボストロムが『スーパーインテリジェンス』を出版。人類よりもはるかに賢い存在が登場したら、いかにしてそれをコントロールするかという問題を、哲学者の立場から考察した書籍です。これは、この分野で強い影響力を持つ1冊になりました。かのイーロン・マスクも本書を読んで、AIは「核よりも危険かもしれない」とツイートして物議を醸しました。
2015年にプエルトリコで行われたFLIの会議にマスクは出席し、1000万ドルの資金提供を発表しました。さらに彼はサム・アルトマンら複数の投資家と共同で10億ドルを出資し、OpenAIを設立[6]。現在でこそChatGPTやDALL-E(ダリ)などのサービスを提供するIT企業として知られているOpenAIですが、当初は安全かつ有益なAIを追求する非営利企業として設立されました。
2016年、ディープマインド社のAI「AlphaGO」が、世界最強の棋士の1人イ・セドルに勝利しました[7]。AlphaGOは囲碁における様々な盤面の強さを深層学習によって学んだAIです。囲碁はチェスよりもさらに複雑で、当時、人間を超えるAIの登場にはまだ10年以上かかると考えられていました。ところがAlphaGOは、イとの5番勝負に打ち勝ったのです。とくに第2局37手目は棋界に衝撃を与えました。それまでの囲碁の常識から外れた、独創的な一手だったのです。
AlphaGOの勝利というニュースを受けて、当時世界最高位だった棋士の柯潔(か・けつ)は、次のように述べました。
私自身が「AIの発展はただごとではないぞ」と感じたのは、2017年。美少女キャラクターの二次元イラストを生成する「MakeGirls.moe」というサービスがリリースされたときです[8]。絵柄こそ古く、崩れも大きかったものの、「もう一歩で実用化できるレベルだ」と私に感じさせるには充分でした。5年以内には、商業的に実用可能なレベルの画像生成AIが登場するだろうと感じました。
2022年7月、果たしてその通りになりました。
画像生成AIサービス「Midjourney」が公開されたのです。翌8月にはStability AI社が「Stable Diffuison」をオープンソース化。さらに11月にOpenAIが「ChatGPT」を公開したことで、世間では「生成AI」がにわかにバズワードになりました。
(※ Midjounrneyを用いたマンガ『サイバーパンク桃太郎』の冒頭部分を私がTwitterに投稿したのは8月10日だった。Stable Diffuisonの公開は、『サイバーパンク桃太郎』の制作作業中のできごとだった。この作品は翌年3月に新潮社より出版され、世界初の商業出版されたAI作画マンガとなった。この仕事により、私は2023年のタイム誌が選ぶ「世界で最も影響力のあるAI業界の100人」に選出された。)
(※「ChatGPT」はサービスの名前であり、AIのモデルの名前ではない。公開当初のChatGPTは、内部では「GPT-3.5」というモデルが動いていた。2023年3月にはGPT-4が公開され、その精度の高さで話題をさらった。)
この原稿を執筆している2024年3月現在では、LLM(Large language Models/大規模言語モデル)にせよ画像生成AIにせよ、多数のモデルおよびサービスが乱立して覇を競っている状況です。ここ数週間は、Anthropic社の「Claude 3」というLLMが、GPT-4を超える高性能なAIとして話題です。2022年7月から現在までの1年半、ほぼ毎週のペースで驚くようなブレイクスルーのニュースが届きました。
無断学習の問題と、画像生成AIの仕組み
現在の生成AIは、オンライン上の膨大な著作物を学習データセットとして用いているものが珍しくありません。そうした著作物の権利者に利益を還元すべきではないかという議論があります。中には、生成AIはいわば「コラージュ生成マシン」で、学習データセットに含まれていた画像や文章を「切り貼り」しているだけだと主張する人もいます。後者の視点に立てば、生成AIは存在そのものが著作権侵害の産物ということになってしまいます。
私はブロガーとしてライターのキャリアをスタートしました。他言語に翻訳された著作もいくつかあります。「DeepL」のような翻訳AIや、ChatGPTのようなLLMに、私の著作物を無断で学習された可能性があります。私はこの問題の当事者の1人です。
その立場から「無断学習」について考えると、「仮に利益還元があるとして、一体いくらの報酬をもらえるのだろう?」という疑問がどうしても浮かびます。
莫大なデータセットのうち、私の著作物が占める割合はどれほどでしょうか? 何億分の一でしょうか? それとも何百億分の一でしょうか? もしも収益が還元されたとして、年間で数円でももらえたらいいほう……という状況になるのではないでしょうか。
であれば、生成AIをオープンソースで(少なくとも無料で)利用できるようにして欲しいと私は感じます。数円足らずの報酬を得るのに比べて、そのほうがよほど私にとって利益が大きいからです。SNSで外国人の投稿を読むために「翻訳」ボタンを押すたびに、私は生成AIの技術の恩恵を感じます。「生成AIを手軽に使えること」そのものが、私にとって最大の利益還元なのです。
したがって、「お前は自分の作品を無断学習されていいと考えているのか?」と訊かれたら、答えは当然、「イエス」です。
翻訳AIやLLMを触るたびに、その便利さに私は胸を打たれます。もしも私の文章を学習した生成AIが存在するとして、それが広く使われているとしたら、人類の生活を豊かで便利にすることに(何百億分の一かでも)貢献できたことを嬉しく思います。
(※これはあくまでも当事者の1人としての私の考え方・価値観にすぎない。誰もが私と同じ考え方をすべきだと主張しているわけではない。)
生成AIは「コラージュ生成マシン」だという主張は、完全に間違っています。生成AIの仕組みを理解していないことによる誤解にすぎません。
Stable Diffusion v1.5は約58億枚から成る学習データセットからトレーニングを行いましたが、その本体部分にあたるモデルデータは約4ギガバイトしかありません。計算方法にもよりますが、画像1枚あたり1~2バイトしか記憶していないのです。コンピューターの世界では、半角文字1文字あたりの情報量が1バイトです。こんなわずかな情報量では、とても「切り貼り」はできません。学習データセットに含まれていた画像の断片を覚えているわけではないのです。
大胆な喩え話をすれば、生成AIは画像の断片ではなく、人間でいえば概念のようなものとして画像の特徴を覚えていると言えるかもしれません。だからこそ、学習データ1枚あたり1~2バイトというごくわずかな情報量で、高精度の絵を描くことができるのです。
(※この比喩は科学的厳密さには欠ける。ヒトの脳がどのように「概念」を覚えているのかは充分に解明されていないので、現在のAIにどれほど似ているのかも不明である。)
生成AIはヒトの仕事を奪うか?
技術革新にともなう経済成長とは、要するに「機械化」を意味しています。蒸気機関が炭鉱の排水を始めたときから(あるいは歴史を遡って、槍を投げる代わりに弓矢を使い始めた頃から)、人類文明は人間の仕事を機械に置き換えることで発展してきました。
この話題でよく引用されるのは、馬の飼育頭数です。
イギリスの馬の飼育頭数のピークは1901年325万頭。しかし19世紀後半に発明された内燃機関の普及により急速に数を減らし、1924年までに200万頭を下回りました[9]。アメリカの場合、1915年には約2600万頭もの馬が飼育されていましたが、1960年には約300万頭まで激減しました[10]。
生成AIの普及により、私たち人間の労働者も、当時の馬と同様の運命をたどってしまうのでしょうか?
しかし私は楽観的です。理由は3つあります。
理由①「労働塊の誤謬」
教科書的に言えば、「技術革新によって人間の仕事が奪われて失業者が溢れる」というのは、歴史的事実に即さない素朴な誤解です。「労働塊(かい)の誤謬(ごびゅう)」という名前までついています。
たとえば都市化率について考えてみましょう。江戸時代には人口の大半を占めていた日本の農業従事者は、2020年には136万3000人まで減りました[11](※農業を主な収入源としている基幹的農業従事者の人口。)。これは総人口のわずか1・08%にすぎず、食糧輸入が増えたことだけでは、この減少幅は説明しきれません。収量の多い品種が開発されただけでなく、トラクターや田植え機などの機械化が進んだことも大きな要因です。
さらに、除草剤や殺虫剤、肥料の品質が向上したことも無視できません。これらは害虫・害獣の対策や雑草の駆除、たい肥の鋤込みなど、それまで農家の人々が自分の手で行っていたことを、農薬工場の化学生産設備で代替できるようになったのだと見做せます。機械が人間の仕事を奪い続けた結果が、今の農業従事者の少なさに繋がっているのです。
では、農業人口の減少にともなって日本は失業者で溢れたでしょうか?
答えは当然、ノーです。
これは農業に限りません。たとえば1792年に中国に上陸したイギリスの外交官ジョージ・マカートニーは、国王ジョージ3世から乾隆帝へのプレゼント600個を届けるために、荷車90台と荷かご40台、馬200頭、そして3000人もの苦力(クーリー)を雇う必要がありました[12](※苦力とは、かつての中国・東アジアにおける下層労働者のこと。)。
現代なら同じ荷物を、大型トラック数台と運転手2~3人で運べるでしょう。もしも技術革新が失業をもたらすなら、現代までの約230年で中国は失業者で溢れているはずです。しかし、現実は違います。当時は苦力となっていたような非熟練労働者たちは、現代では道路の整備や自動車工場のライン工など、新たに生まれた職業に就くようになりました。生活水準も大幅に向上しました。
たとえば活版印刷は、当時の写字生の仕事を奪いました。ガス灯の普及は、ロウソク職人の仕事を脅かしたでしょう。しかし電灯の普及により、ガス灯の「点灯夫」の仕事も奪われました。かつて電報を運んだメッセンジャーボーイの仕事は、電話の普及によって奪われました。電話交換手の女性たちの仕事は、電話交換機の普及で失われました。「計算手」の仕事は、電子計算機によって代替されました。
20世紀に消えた仕事を数え上げればきりがありません。
それでも、世界人口の9割が失業するなどという事態には陥っていません。むしろ、私たちの仕事は忙しくなってさえいます。
技術革新は職業を消失させます。が、同時に新たな職業も生み出すので、長期的には失業を吸収するのです。歴史を振り返ると、「機械が人間の仕事を奪う」という見方は間違っていると言っていいでしょう。より正しくは、「機械を使える人間が、機械を使えない人間の仕事を奪う」のです。
したがって問題は、技術革新そのものではなく、その「速さ」だといえます。
技術革新のせいで失職した人が新たな仕事に就くためには、新たなスキルセットを身に着けなければなりません。人間の学習能力を上回る速さで技術革新が進んだら、取り残された人は失業状態に留め置かれることになります。失業中の人に「長期的には失業は解決する」と言っても、何の慰めにもならないでしょう。経済学者ジョン・メイナード・ケインズの有名な格言の通り、「長期的には私たちは全員死んでいる」のですから。
理由② 技術革新の速さには上限がある
では、AIの進歩は「速すぎる」のでしょうか?
この進歩が止まることはないのでしょうか?
もしも「AIによって奪われる仕事の総数が、新たに生まれる仕事の総数よりも常に多い」という前提が成り立つなら、AIによる失業は解決できなくなるでしょう。
しかし、この前提は成り立ちません。なぜ産業革命がイギリスから始まったのかを思い出せば分かる通り、革新的な技術は、利益を出せる範囲でしか普及しないからです。
真偽のほどは不明ですが、こんな小話があります[13]。
ある日、フォード社のCEOヘンリー・フォード2世が、全米自動車労働組合(UAW)会長ウォルター・ルーサーと一緒に最新鋭の機械化された生産ラインを見学しました。
フォード2世は皮肉っぽく言いました。
「ウォルター、ここにいるロボットたちからどうやって組合費を徴収するつもりかい?」
するとウォルターはすかさず答えたそうです。
「ヘンリー、ここにいるロボットたちにどうやって車を買わせるつもりかい?」
この小話は、技術革新の速さにも上限があることを端的に表しています。労働者は、最大の消費者でもあります。彼らが貧しくなりすぎれば、企業は利益を出すことができず、技術革新も鈍化するはずです。
ここで考えるべきは、(もしも仮に低賃金による技術革新の鈍化が起きるとして)一体どれくらいの賃金水準で均衡するのか、でしょう。その水準があまりにも低ければ、たとえ失業者がいないとしても、やはり私たち労働者は幸せにはなれません。
これは技術革新の問題ではなく、労働問題だと私は考えています。
なぜなら、20世紀には爆発的な技術革新があったにもかかわらず、私たちの所得水準も大幅に伸びたからです。その背景の1つには、労働組合が合法化されて、建設的な労使交渉が可能になったという事情があります。
労働市場が自由で「完全な市場」というのは幻想です[14]。企業側は労務・法務の専門家を雇い、労働者個人よりもたくさんの情報を持っています。企業の総数と労働者の人口を比べれば分かる通り、企業側はよりたくさんの選択肢から雇用者を選べます。つまり労働市場において企業は基本的に有利な立場であり、プライスメイカーとして振る舞えるのです。この力関係を是正するには、労働者側も組織を作るしかありません。
労働組合は、ある意味では労働力の不当廉売を禁じる価格カルテルです。反面、企業と労働者との力関係を是正し、労働市場を機能させる役割も果たしていると言えるでしょう。
理由③ 人類学的惰性
2004年、通話アプリ「Skype」が登場しました。当時大学生だった私は、これを使えば在宅勤務が当たり前になるし、東京の満員電車も解消されるだろうと予想しました。自分が就職する頃には、よれよれのスーツを着て痴漢冤罪を恐れながら電車に揺られる生活など過去のものになっているだろう、と希望を抱いたのです。
しかし現実には、2020年のコロナ禍まで日本で在宅勤務が普及することはありませんでした。パンデミックが収まりつつある今では「オフィス回帰」が叫ばれています。最悪の時期に比べればマシになったとはいえ、東京の通勤電車はいまだに殺人的に混雑します。
人間は、便利な技術が登場しただけでは、簡単には習慣を変えないようです。
私はこれを「人類学的惰性」と呼んでいます。
Skypeに限りません。私の取引先の中には、今でも紙の請求書の郵送が必須な企業があります。見積書を一旦プリントアウトして、押印して、スキャナでpdf化してからデータ送信するという手間が必要な企業もあります。FAXの普及率はいまだにゼロになっていません。私は姪っ子たちへのお年玉を「〇〇ペイ」で渡したいとは思えません。
1840年代の鉄道や、1995~2005年のインターネットは、世の中を一変させました。が、すべての技術革新に同じ力があるわけではないのです。
人間が行動を変えることにはコストがかかります。社会全体の常識・習慣を変えようとすれば、そのコストは莫大なものになります。新しい技術が普及して、古い習慣を消滅させられるかどうかは、そのコストを超えられるかどうかにかかっています。10年単位で時間を要することも珍しくありません。
話を馬に戻しましょう。
イギリスの馬の飼育頭数のピークは1901年、産業革命の歴史を考えると、かなり最近です。1830年のリヴァプール&マンチェスター鉄道の開通から見ても、約70年も後です。蒸気機関車の登場により、「馬車鉄道」は姿を消していきました。しかし、経済全体が成長した結果、移動や動力の需要が高まり、馬の需要はむしろ増したのです。
もしも生成AIが本当に素晴らしい技術であるなら、経済全体を大きく成長させてくれるはずです。「労働塊の誤謬」の話にも繋がりますが、仕事の数は増えるし、私たちは今まで以上に忙しくなるでしょう。70年後にこの世界がどのような場所になっているのかは分かりません。しかし、この先の10年くらいは、失業よりも過労を心配すべきだと私は思います。
アーティストの仕事は技術革新に耐性がある。
生成AIの発展により失われる仕事は、残念ながらたくさんあるでしょう。しかし、アーティストの仕事は失われないどころか、むしろ表現の幅が広がり、より豊かになる可能性を秘めていると私は考えています。
生成AIの現状を鑑みれば、これは的外れな意見だと見做されるもしれません。なぜなら現在の生成AIブームは、創造的な活動――画像生成、文章執筆、音楽や動画の生成など――を得意とするAIから始まったからです。
それでも歴史を振り返れば、娯楽や芸術は技術革新に対して高い耐性を持っていることが分かります。娯楽や芸術は、通信や運輸とは違います。たとえばインターネットがあれば伝書鳩は要りません。自動車があれば馬車は要りません。けれどアーティストの仕事は、そういうものではないのです。
写真が発明されたからといって、絵描きは絶滅しませんでした。むしろ印象派やキュビズムなどの、写実主義から離れた表現が探求されるようになりました。レコードやラジオの登場は、酒場でバイオリンを演奏してお捻りをもらうというビジネスを脅かしました。それでも、ジャズバーやディナーショーというビジネスは失われていません。映画が発明されても演劇は廃れませんでした。テレビが発明されても、映画は生き残りました。無声映画の活動弁士(※無声映画の上映中に演技を交えながらセリフを読み上げる職業)ですら、完全にいなくなったわけではありません。
新しい技術が生まれても、即座に古い表現方法が失われるわけではないのです。
むしろ、表現方法の選択肢が増えるだけです。
ビデオゲームの世界では、これだけ3DCGの発達した現在でも『Undertale』や『Stardew Valley』のようなドット絵の作品がヒットしました。映画では、フルカラーが当然になった現在でも、『シンドラーのリスト』や『アーティスト』のように、あえてモノクロの表現を選ぶ作品が撮影されています。落語や歌舞伎は伝統芸能として博物館で保存されているわけではなく、いまだに庶民の娯楽です。小中学生も読む『少年ジャンプ』に落語がテーマのマンガが連載され、スーパー歌舞伎という新旧の美点を取り入れた演目が人気を集めています。
アーティストの仕事は、ある側面では経済的合理性の埒外にあります。安く経済的に作れるからといって、それが需要に繋がるとは限らないのです。
たとえば初音ミクがあれば、人間の歌手を雇わなくても安上がりに歌を演奏できます。しかし、高い費用がかかるとしても人間の歌を聴きたいと私たちは感じます。あるいは画像生成AIがあれば、マンガのコマを安上がりに埋めることができます。しかし、たとえコストがかかっても、人間のマンガ家に描いてもらったほうが、はるかに素晴らしい仕上がりになります。
生成AIが人間のアーティストに勝てない理由
生成AIの性質から考えても、これがアーティストの仕事を消滅させるのは難しいと感じます。なぜなら現在の生成AIには、大きな欠点が2つあるからです。
第一の欠点は、生成AIの創造性には欠陥があることです。
人間の「創造性」は、大きく3つに分類できるという考え方があります[13]。
①組み合わせ的創造性
既知の知識や情報の組み合わせによって、新しい何かを生み出すというタイプの創造性。「アイディアとは既存の要素の新しい組み合わせ以外の何ものでもない」という有名なジェームズ・W・ヤングの格言は、このタイプの創造性に言及しています。
②探索的創造性
既知の知識や情報を、何らかのルールや手続きに従って探索することで発揮される創造性。アイディアを「発見」するタイプの創造性といってもいいかもしれません。
③革新的創造性
既存の知識や情報、ルールを飛び越えて新しいアイディアにたどり着くタイプの創造性。いわゆる「天才のひらめき」と呼ばれるものは、このタイプの創造性でしょう。
このうち①組み合わせ的創造性であれば、生成AIにも備わっていると言えそうです。むしろ、学習データの大きさと演算の速さから考えれば、組み合わせ的創造性で何かを生み出すことは人間よりも得意かもしれません。
その一方で、現在の生成AIが②探索的創造性を持つかどうかには議論の余地があると私は思います。③革新的創造性に至っては、私たち人間がなぜそのようなものを持てるのかも充分に理解できているとは言い難いでしょう。生成AIがこれを身に着けるのは、まだ少し先のことになりそうです。
第二の欠点は、現在の生成AIはヒトの感情を理解できないことです。
たとえばマンガに的を絞って考えてみましょう。マンガにおける「上手い絵」とは、デッサンが正確な絵や、綺麗な絵だとは限りません。究極には「読者を感動させる絵」が、最も上手い絵だと言えます。世間的には「下手うま」や「味がある」と評価されるマンガ家がいます。デッサンは狂っていて、線はガタガタで、トーンの貼り方も綺麗とはいえない――。それでも読者の心を動かし、ヒットを連発している先生たちがいます。それも1人や2人ではありません。マンガで必要とされるのは、何よりもまず読者に「面白い!」と感じさせる絵であるはずです。
では、どんな絵を描けば読者に「面白い!」と感じてもらえるのか?
現在の生成AIは、この質問に答えることができません。
生成AI自身には「面白い!」と感じる意識や自我、主観的経験がないからです。人間が何を「面白い!」と感じるのか理解していないし、できないのです。人間の読者の感情を予測するのは、同じ人間のほうが得意なのです。
AI研究の第一人者スチュアート・ラッセルは次のように述べています[14]。
創造性に欠落があることと、ヒトの感情を理解できないこと――。
この2つの欠点を克服できない限り、機械が人間のアーティストを駆逐することはできないでしょう。現在の生成AIには、生成物を評価して加筆修正する人間のオペレーターが必須です。むしろ、生成AIを用いた新たな表現の選択肢が増えていくでしょう。
かつての馬たちのようにアーティストの仕事が消失するという主張は、生成AIの能力を過大評価し、人間の潜在能力を舐めています。
人間は馬でも伝書鳩でもないのです。
(※作品を公開してもすぐに無断学習されてしまうのであれば、その作品から利益を得られないので、誰も創作活動をしなくなるという主張がある。この主張も、やはり人間の創造性をバカにしている。まず本章で書いた通り、作品から利益を得られなくなるという前提は疑問だ。何より、ヒトが創造性を発揮するのは金銭的な利益のためだけではない。私たちが創作活動をするのは、創作活動が楽しいからだ。)
機械が完全に仕事を奪う未来
生成AIに対する私の楽観論は、基本的には歴史に基づいています。
「労働塊の誤謬」にせよ、アーティストの仕事にせよ、過去の歴史を振り返って大丈夫だったのだから、今回も大丈夫だろう……という論法です。
当然ながら「今までは大丈夫だったが、今回ばかりは別だ」という反論があるでしょう。
実際、もしも次の2つの前提が満たされたなら、人間の仕事は完全に無くなるはずです[15]。
①人間は、機械にはできないタスクを見つけることができない。
②新たなタスクが発明・発見されたら、機械が瞬時に、かつ格安で、人間を代替してそれを実行するようになる。
もしもその時代が来たら、私たちはどんな社会を作るのでしょうか?
古代ギリシャの市民のように、奴隷の代わりに機械に仕事をさせて人間らしい余暇や思索にふけるのでしょうか? それとも映画『ウォーリー』で描かれたように、機械に世話を焼いてもらいながら赤ん坊のように毎日を過ごすのでしょうか? あるいは機械を所有する資本家階級が豊かな社会を作り上げる一方で、大多数の貧乏人は貧困にあえぐことになるのでしょうか?
その時代が来たら、ベーシックインカムの議論も現実味を帯びそうだと思えます。
とはいえ、現在の生成AIでは全くの力不足でしょう。この2つの前提を満たすためには、AIが発達するだけでは不充分で、タスクを実行するロボティクスの技術にもたくさんのブレイクスルーが必要です。どちらかといえば、次回の記事で扱う「超知能」が登場した後に問題となる話題でしょう。(サイエンス・フィクションとして想像するぶんには楽しい話題ですが)
注意すべきはAIの独占
歴史上、支配的な階級の人々は技術革新を嫌ってきました。技術革新にともなう経済・社会構造の変化は、自らの支持基盤を揺るがし、権力を失うリスクを高めるからです。活版印刷機を拒絶したオスマン帝国のスルタンたち。リーの靴下編み機を許さなかったエリザベス1世。旗振り通信を不正行為だと見做した江戸時代の役人――。そうした例は枚挙にいとまがありません。
産業革命が始まっても、東欧やロシアの支配者たちは鉄道の敷設に反対し、現状維持に腐心しました。結果、国際競争の中で出遅れて、結局、権力を失うことになりました。私は以前、産業革命後の世界の特徴は人類が「科学は儲かる」と気づいた点にあると書きました。が、それだけではありません。支配者たちが科学技術の重要性に気づいた時代でもあるのです。
現代の権力者は、前近代のように技術革新を真正面から拒絶することは滅多にありません。その代わり、それを規制して、自らの権力を脅かすような研究がなされないように軌道修正し、その技術から得られる利益を独占したいというインセンティブを持ちます。
(※ここでいう「利益」は金銭的利益だけでなく、監視社会を作れることやディープフェイクを用いたプロパガンダが容易になることなど、政治的な利益も含まれる。)
したがって私たち一般庶民の立場では、権力者によるAIの規制と独占にこそ注意を払うべきでしょう。
AIの悪用
もちろん、AIに対する規制や監視が全く必要ないとは私も思いません。
現在の生成AIも、すでに様々な悪用の方法が発見されています。
一見すると無害そうな翻訳AIですら、国際的なスパムメールに応用されています。この先、翻訳の精度が上がり表現が自然になるほど、詐欺を見破るのは難しくなるでしょう。
SNSにはLLMを用いた「インプレゾンビ」が溢れるようになりました。現在のTwitter(現:X)では、投稿のインプレッション数(※表示回数)に応じて金銭報酬が支払われます。それを目当てに、LLMで生成した文章を自動的にリプライするボット・アカウントが無数に作られているのです。これはSNSの利便性を大きく損ないます。
画像生成AIにより、以前から問題だったディープフェイクをより手軽に作れるようになりました。さらに、特定のアーティストの絵柄を再現して贋作を出力できるAIが、比較的簡単に作れるという問題もあります。ある程度のノウハウを身に着けたAIユーザーなら、たとえば「スタジオジブリ風の絵柄で描かれた『ドラゴンボール』の孫悟空のイラスト」を、AIに描かせることができてしまうのです。
(※とくに普及している技術の1つに「LoRA(ローラ)/Low-Rank Adaptation」がある。)
(※大抵の国の著作権法で、絵柄もキャラクターも保護の対象にならない。著作権は「表現」を保護する権利であり、「アイディア」までは保護しないからだ。もしもアイディアまで著作者が独占できるとしたら、パロディやオマージュ、二次創作は不可能になる。絵柄やキャラクターを守りたい場合には、著作権以外の知的財産権を用いることを検討すべきだろう。)
私見を述べれば、絵柄やキャラクターを再現するAIも(映像作品の私的録画が許されるのと同様に)個人で楽しむ範囲内であれば許されるのではないかと思います。
しかし、贋作をインターネット上に公開したり、それを販売したりすれば話は別でしょう。中には、贋作を使ってイラストレーターに嫌がらせを繰り返す愉快犯まで存在します。言語道断の行為です。
より深刻なのは、権力者がAIを悪用した場合です。
AIの力を借りれば、『一九八四年』も真っ青の全体主義国家を作り出すことができるはずです。
旧東ドイツの国家公安省、通称「シュタージ」は、「歴史上最も実効性が高く抑圧的な諜報および秘密警察機関の1つ」だったと見做されています[16]。彼らはあらゆる場所に隠しカメラや盗聴器を仕掛け、手紙を検閲し、200兆ページに達する紙の記録を残しました。就労人口のじつに4分の1がシュタージ要員だったという推計もあります。旧東ドイツは、人間の能力だけで実現できる監視社会の上限に近いでしょう。
しかしAIを用いれば、これを超える監視社会を作れます。
個人的な話をすれば、こんな経験をしてゾッとしたことがあります。
パソコンで航空券を予約したところ、出発の当日、スマートフォンに「もうすぐ出発です」という通知が届いたのです。パソコンのブラウザはGoogle Chrome、スマホはAndroid、通知を飛ばしたアプリはGoogleカレンダーでした。つまり、私自身は何か特別な設定をしたわけではないのに、Googleのサービス間で情報が共有されていたのです。
Googleは私のメールアドレスや電話番号、カード番号はもちろん、映画の趣味やポルノの好みまで知っています。私はFitbitというスマートウォッチを愛用しているので、健康状態まで筒抜けでしょう。「BIG TECH IS WATCHING YOU!!」というネットスラングを思い浮かべずにはいられません。
(※小説『一九八四年』に登場する「ビッグ・ブラザーはあなたを見ている/BIG BROTHER IS WATCHING YOU!!」というセリフをもじったもの。)
もしもこの相手がGoogleではなく全体主義国家だったら?
「国民全員を24時間監視する」という独裁者の夢は、現在のデジタル技術を用いればすでに実現可能です。
さらに、心の内面を監視できる可能性さえあります。
画像生成AIの技術を応用すれば、何かの写真を見せたときの脳活動の様子をfMRIで撮影し、そのfMRIの画像から「見ていた写真」を復元することが可能になりつつあるのです。fMRIの撮影は準備に手間がかかりますから、現在はまだ、脳活動の様子から「何を見ているか/何を思い浮かべているか」をリアルタイムで画像生成することはできません。
しかし、この技術の進む先には、内心の自由が脅かされる未来があります。たとえば同性愛の禁じられている全体主義国家で、同性愛行為を「思い浮かべた」だけで逮捕されてしまう――。そんな未来もありうるでしょう。数あるAIの悪用方法の中でも、とくに今後の進展を注視する必要がある分野だと私は考えています。
免許制や許可制は、絶好の口実を与えてしまう
以上はごく一例ですが、AIの技術には様々な悪用方法が思い浮かびます。
それでも私は、免許制や許可制には賛同できません。なぜなら、AIから得られる利益を独占したい権力者や資本家たちに、絶好の口実を与えてしまうからです。それは人権の蹂躙や経済的格差の拡大に繋がります。AIの研究および利用は、できる限り民主的かつオープンであるべきです。
したがって規制や罰則を設けるにしても、「AIを研究すること」や「AIを使用したこと」ではなく、AIを使った行為の「結果」に設けるべきだと私は考えています。たとえばスタジオジブリ風のイラストを生成できるAIを作ったとしても、自宅で私的に楽しむぶんには許されるべきだと思います。しかし贋作を販売することは、AIで生成したものだろうと人間の腕で描いたものだろうと、当然、罰されるべきでしょう。
(※この考え方は、現時点での日本政府の方針とおおむね一致している。たとえば著作権侵害について、文化庁は令和5年6月19日のセミナーで「AIを利用して画像等を生成した場合でも、著作権侵害となるか否かは、人がAIを利用せず絵を描いた場合などの、通常の場合と同様に判断され」るという方針を明確にした[17]。)
現在の生成AIのコミュニティは、1920年代のラジオ・コミュニティや、1970年代のパソコン・コミュニティに似ています。オンライン・オフラインを問わず、生成AIの愛好家たちが日夜情報を交換し、趣味的に研究を進めているのです。このコミュニティから、将来、放送産業やパソコン産業に匹敵する大きな産業が生まれるかもれしません。
AIの技術は、権力者や資本家に独占させるべきではありません。
誰もが自由に研究して、使用できる――そして万が一悪用した場合は、その結果に応じて罰される――そういう技術であるべきです。
(次回、「超知能AIの脅威」編に続く)
(この記事はシリーズ『AIは敵か?』の第17回です)
★お知らせ★
この連載が書籍化されます!6月4日(火)発売!
※※※参考文献※※※
[1]バイロン・リース『人類の歴史とAIの未来』(ディスカヴァー・トゥエンティワン、2019年)P.85
[2]ケイト・デヴリン『ヒトは生成AIとセックスできるか―人工知能とロボットの性愛未来学』(新潮社、2023年)P.52-61
[3]スチュアート・ラッセル『AI新生』(みすず書房、2021年)P.4-5
[4]今井翔太『生成AIで世界はこう変わる』(SBクリエイティブ、2024年)P.42-43
[5]マックス・テグマーク『LIFE 3.0 人工知能時代に人間であるということ』(紀伊國屋書店、2020年)P.457-462
[6]テグマーク(2020年)P.468-472
[7]テグマーク(2020年)p120, 129-133
[8]Gigazine 美少女キャラクターを人工知能が自動生成してくれる「MakeGirls.moe」
https://gigazine.net/news/20170814-make-girls-moe/
[9]グレゴリー・クラーク『10万年の世界経済史』(日経BP社、2009年)下巻P.148
[10]テグマーク(2020年)p186
[11]農林水産省 特集 変化(シフト)する我が国の農業構造 (1)基幹的農業従事者
https://www.maff.go.jp/j/wpaper/w_maff/r3/r3_h/trend/part1/chap1/c1_1_01.html
[12]ウルリケ・ヘルマン『資本の世界史 資本主義はなぜ危機に陥ってばかりいるのか』(太田出版、2015年)p31
[13]今井(2024年)p156-157
[14]ラッセル(2021年)p100
[15]リース(2019年)p131の記述が着想。リースは9つの前提を挙げているが、私なりに2つに整理した。
[16]ラッセル(2021年)p105-106
[17]文化庁 令和5年6月19日著作権セミナー「AIと著作権」講演資料 p43
https://www.bunka.go.jp/seisaku/chosakuken/seidokaisetsu/seminar/2023/pdf/93903601_01.pdf