
これはAGIなのか?
8,424 文字
今、インターネット上ではAGI(人工汎用知能)に関する話題で持ちきりです。私は最近、O3の登場によってAGIが実現したのかという内容の動画を公開しましたが、AGIについての議論はまだまだ続いています。そこで、AGIとは何か、そして私たちがそれを達成したのかどうかについて、より学術的な見解を示したいと思います。
もちろん、私は学界全体を代表しているわけではありません。教育学の博士号を持つ者としての視点からお話しします。しかし、できるだけ論理的に説明していきたいと思います。
まず理解していただきたいのは、これは学術的な視点ですが、AGIは学界だけのものではないということです。数学者のものでもなければ、コンピュータサイエンティストのものでもありません。AGIの定義は私たち全員のものです。社会全体のものなのです。私たち全員が集まって考える必要があります。これは何を意味するのか、良い定義とは何かを。
本物の人間、本物の知能とは何を意味するのか、考えてみましょう。考慮すべき側面は多岐にわたりますが、まずは学術的な観点から説明し、その後で議論を深めていきたいと思います。私たちが前に進むためには、皆さんの意見、考え、検討、熟考が必要です。ぜひコメント欄で意見を共有してください。
まずは「知能」の一般的な定義から始めましょう。Googleで「intelligence(知能)」の定義を検索すると、オックスフォード辞典から「知識とスキルを獲得し、適用する能力」という説明が出てきます。これは知能の一般的な理解の基準として良い定義ですが、私たちが求めているのは人工汎用知能の包括的な定義です。
では、Googleで人工汎用知能の定義を調べてみましょう。すると、明確な定義が示されていないことに気づきます。これは、AGIの定義についてまだ多くの議論や debate があるからです。だからこそ、ゴールポストが動き続けているのです。つまり、開発が進むにつれて定義が修正され続けているのです。
前回の動画で私が説明したように、これは予想されることであり、私たちはそれを受け入れるべきです。私を含む多くの人が、定義が変更されることを望んでいません。論理的な考えを持ち、それを達成したら前に進めるようにしたいと思っています。しかし、コンピュータに適用する際の人間の知能の本当の意味について、私たちはまだまだ多くのことを学んでいるのです。
では、主要プレイヤーたちのAGIの定義を見てみましょう。まずはOpenAIのチャーターを見てみましょう。そこには「OpenAIの使命は、人工汎用知能(AGI)、つまり経済的価値のある仕事のほとんどで人間の能力を上回る高度に自律的なシステムが、人類全体の利益となることを保証することである」と書かれています。これは短くも広範な定義です。経済的価値のある仕事を自律的にできるということですが、経済的価値のある仕事とは誰が定義するのでしょうか?また、自律的とはどの程度を指すのでしょうか?全て自動的にできるのか、一部自動的にできるのか、その範囲はどこまでなのか。この定義はシンプルですが、具体的な指標としては不十分です。
次に、The Vergeの記事から別の定義を見てみましょう。MicrosoftのAI部門のCEO、ムスタファ・スレイマンは人工汎用知能について次のように定義しています。「AGIは、人間レベルのすべての学習環境で優れたパフォーマンスを発揮できる汎用学習システムです。これには知的労働も含まれます。ちなみに、ロボット工学における作業の進歩と複雑さについては私もかなり懐疑的ですが、はい、大量の手作業による事前のプロンプトがなくても、非常に幅広い環境で優れたパフォーマンスを発揮できるシステムが実現できると十分想像できます。」
ロボット工学の側面は一旦置いておくとして、この定義は「学習できる」という点を強調している点で、より良い定義だと思います。これは先ほどの知能の定義、つまり学習する能力という部分とよく一致します。人工汎用知能の良い定義として、より適切だと考えられます。
では、O3は何を達成したのでしょうか?インターネット上になく、事前学習されていない新しい質問に対して、適切な推論で答えることができました。これは一種の学習と言えるかもしれません。しかし、それを新しい方法で適用し、継続的に学習していくという点では、まだ十分とは言えません。
また、実際のコンペティションには多くの制約があります。使用できる金額や時間が制限されており、O3は人間レベルの85%ではなく75%程度の達成率でした。しかし、AIに16時間かけて継続させたところ、それらの指標を上回ることができました。ここでも、私たちは定義と制約条件について決定を下す必要があります。確かに前進していますが、もう一つの定義を見てみましょう。
この定義は、ChatGPT自体から得られたものです。「AIのリーダーや科学者たちの意見に基づいて、人工汎用知能の適切で影響力のある定義を作成してください」と入力したところ、次のような回答が得られました。「人間レベル以上のパフォーマンスで、幅広いタスクにわたって理解、学習、推論、知識の適用が可能な、高度に適応性があり自律的なシステム。AGIは、新しい未知の文脈に対して知能を一般化する能力を持ち、創造性、問題解決能力、感情知能を示す必要があります。また、その行動が安全で有益かつ公平であることを確保するため、倫理的原則に沿って動作し、人類全体の幸福と進歩を促進する必要があります。」
これはChatGPTからの非常に良い定義です。AIがこのような定義を提供してくれるのは興味深いですね。表現の仕方が非常に外交的であることがわかります。特に「学習」が重要な要素として含まれていることを高く評価します。また、単なる論理だけでなく、感情の側面も含めている点も優れています。
なぜなら、それこそが私たちを人間たらしめているものだからです。倫理的な考慮が必要で、決定を下すのは単なる論理だけでなく、倫理や感情も含めて総合的に判断する必要があるのです。
これは、意識やモラルの側面も考慮する必要があるという別の問題へと私たちを導きます。これによって事態は更に複雑になりますが、現実世界での知的な決定を下すためには重要です。もし道徳や倫理の側面を考慮しないのであれば、それは単なる数学の話になってしまいます。私は、知能とは単なる数学の機能ではないと考えています。数学は知能の非常に重要な側面ですが、他にも多くの要素があるのです。
簡単な例を見てみましょう。知的な自動運転車について考えてみましょう。ブレーキが故障して前進せざるを得ない状況で、大勢の人がいる方向に進むべきか、それとも一人しかいない方向に進むべきか。どちらも悪い選択ですが、決断を下さなければなりません。このような倫理的な側面を組み込む必要があるのです。
このように、これは複雑な問題で、考慮し適用すべき様々な側面があります。創造性の側面についても考える必要があります。創造性がなければAGIではないと主張する人もいますが、これは別の議論を引き起こします。私は、AIは現時点で完全に創造性を持っていると主張します。
一方で、「いや、AIは事前学習されたものを組み合わせているだけで、これはある物語とある物語を組み合わせて新しい物語を作っているだけだ。これは本当の創造性ではない」と主張する人もいるでしょう。しかし、私に言わせれば、それこそが創造性なのです。複数の異なるものを組み合わせて新しいものを作り出すこと、それが創造性の定義です。
同じような物語、同じような作品、同じような芸術作品を組み合わせる。人間を介さずにAIが行うため、ロボット的に見えるかもしれません。しかし、それは創造性です。少なくとも私はそう考えています。物語、映画、動画、画像についても同じことが言えます。すべては他のものの組み合わせなのです。
創造性に関する議論については、AIはすでに十分に持っていると思います。もちろんレベルは異なり、改善の余地はありますが、画像、動画、音声など、様々なソフトウェアで創造性は発揮されています。
AGIの定義に話を戻しましょう。AGIへの道筋について、もう一つの説明があります。これもOpenAI、具体的にはサム・アルトマンから提供されたものです。Forbes誌の2024年7月16日の記事からの引用です。ここでは人工汎用知能に向けた5つのステップが示されています。これがOpenAIによる本物のAGIを達成するための指標です。
レベル1は会話型AIです。これは現在のレベルとされています。ChatGPTを使って普通の会話ができ、スマートフォンを使って感情や関与、理解を伴う、非常にリアルな会話ができます。テキストでも音声でも、これは完全に達成されています。
レベル2は推論です。ここでは、ツールを使用せずに、博士レベルの教育を受けた人間と同程度の基本的な問題解決タスクを実行できることと定義されています。OpenAIのO3モデルを通じて、これも達成されたと強く主張できます。PHDレベルの様々な質問に答える能力があります。
測定方法は多岐にわたります。特定の質問に答えることは、事前学習されているので問題ありません。一般的な知能の観点から言えば、これは許容されます。しかし、テストで示されたような新しい質問を解決する能力、そして新しいモデルでは、テストの一つで99%のコーダーよりも優れたコーディング能力を示し、他のテストでも他の全てのモデルを上回る非常に良い成績を収めました。
現在の推論能力と可能性の観点から見れば、私たちはそれを達成したと思います。このテストで示されたように、より多くの時間を与えることで、さらに良い結果を生み出すことができます。16時間後には87%という高いレベルに達しました。さらに時間をかけたらどうなるでしょうか?モデル自体を変更せずに、より多くの計算能力と能力を与えたらどうなるでしょうか?推論の側面では多くの発展が見られ、このレベルも完全に達成したと言えます。
では、レベル3に進みましょう。ここでは自律型AIについて語られています。AIシステムは、エージェントとして数日間にわたってユーザーに代わって自律的に動作できます。例えば、あなたが休暇中にビジネスの周りでそれらを動かすことができます。これはAIエージェントのことです。
OpenAIはすでにこれについて言及を始めており、Microsoftもco-pilotで、Googleもある程度言及しています。彼らは全て、これが来る、これが来ると話しています。すでに少しずつ出始めていますが、来年の初めには本格的に登場するでしょう。
これは何を意味するのでしょうか?AIがあなたのためにより多くのことを行う真の力を持つということです。もちろんあなたのコントロール下ですが、「これをやって」と指示することができるようになります。つまり、タスクを達成するために複数のステップを実行できるようになるのです。
よく示されるデモンストレーションは、「予約を取って」というものです。単に予約を取るだけでなく、「2月の次の休暇の予約を取って」と指示できます。AIはアクセス権のあるスケジュールを見て、休暇の時間を確認し、100の異なる代理店を検索して、希望する場所での最適な価格を見つけ、最良のアイデアと提案を提供し、許可があれば銀行口座にアクセスして支払いまで行うことができます。
これは複数のステップを実行できるエージェント機能であり、アカデミアにとって非常に重要です。実際に、あるビジネスを立ち上げている人のデモンストレーションを見ました。彼はオンラインコースを受講する必要がありましたが、それは健康と安全に関する必須要件のようなものでした。彼はこのようなデモンストレーションをして、前提条件として「私は自分でこのコースを受講しましたが、AIエージェントが代わりにできるか試してみたかった」と述べました。そこでAIエージェントに「このコースに行って、この学習管理システムにログインし、このコースに進んで、そこにあるすべてのパワーポイントを確認し、最後に多肢選択問題を解いて」と指示しました。AIはそれを実行し、すべての段階を経て、完璧なスコアで合格しました。
これらのエージェントがもたらす意味合いがお分かりでしょう。アカデミアにとっても、ビジネス全般にとっても非常に強力なツールとなります。これがすでに起ころうとしており、Google、その他の多くの機関からプレビューが示されているということは、基本的にこのレベルにも達していると言えます。これがレベル3です。
では、あとどれくらい残っているのでしょうか?次のレベルを見てみましょう。レベル4は「革新的AI」と呼ばれています。これらのAIシステムは、独自にイノベーションを生み出すことができます。単にプロセスを実行するだけでなく、それらを改善し、ルールに従って次の単語を予測するだけでなく、より効果的かつ効率的に目標を達成する方法について批判的に考えることができます。
これは非常に強力でしょう。私の予測では、2025年にはまさにこれを手にすることになるでしょう。AIは研究を支援するだけでなく、実際の研究を行い、結果の分析を行うことができるという報告がすでに出始めています。これは、AIが実際の研究を行い、実際の結果を提供できるという、AIの完全な能力に関する未来です。
一部の方々は確かに躊躇するでしょう。しかし、これを正しく使用することで、私たちは何年も先の未来へと飛躍することができます。ただし、私たちはまだループの中にいて、結果を検証し、プロセスを検証し、物事が正しい方向に進んでいることを確認し、倫理的な側面が守られていることを確認する必要があります。私たちはまだその一部である必要がありますが、これは間違いなく来年に起こることです。すでにそのような報告が出始めています。
これは、AIの発展における重要な部分となるでしょう。これがレベル4であり、私たちはすでにそれに触れ始めています。つまり、あと1レベルしか残っていません。OpenAIが表明したAGIの全体的な定義に関して、最後のレベルを見てみましょう。
最終段階のスーパーAIは、組織全体の仕事を実行できる人工知能を意味します。現在いるすべての人、すべての機能が、協力して改善を行い、人間の洞察なしにすべての必要な業務を実行するエージェントによって実行されます。
ここで話が行ったり来たりしているのがわかります。スーパーAIについて言及していますが、これはAGIとは別物です。AGIは人工汎用知能ですが、スーパーAIは人工超知能を意味し、人間の能力を超えているということです。これは全く別のレベルです。
私はこれがそれほど早く実現するとは考えていません。一部の科学者が予測するような数十年ではなく、数年の問題だと考えていますが、今はAGIについて話を戻しましょう。本質的には、AGIはレベル4を達成することであり、すでに述べたように、私たちはすでにその一歩手前にいます。なぜなら、他の3つのレベルを達成し、2025年にはレベル4に入ろうとしているからです。
ここで一歩下がって、これが本当に何を意味するのか考えてみましょう。これは私たちがAGIに到達したことを意味するのでしょうか?私はいい例えを考えようと努めました。良い教育の一部として、良い例え、良いアナロジーが重要だからです。ただし、これは全て非常に新しいことなので、良い例えを見つけるのは難しいのです。
私が思いついた例えでは、AGIは「食べ物を手に入れられる」ということに似ています。これはどういう意味でしょうか?私たちは何を食べ物として分類するのでしょうか?私の見方では、O3の結果、O3の達成は「塩」を手に入れたようなものです。これが今、私たちが達成したものです。塩は食べ物でしょうか?はい、でも本当の意味ではありません。それはミネラルであり、食べ物の構成要素ですが、完全な食べ物とは言えません。しかし、これは確実に将来の展望を示しています。良い食べ物には塩が不可欠な要素だからです。
もう一つの例えは、AGIはプールであり、私たちは今、飛び込み台の上を走っているようなものです。この時点でもう止まることはできません。私たちはその道を進んでいて、飛び込み台の上で今まさに跳ねているような状態です。完全に中に入っているわけではなく、完全に泳いでいるわけではありませんが、確実にその過程にいます。
「目の前」という言葉は嫌いですが、私たちはすでにその過程の中にいます。プールエリアにいて、深く飛び込む準備をしているのです。
では、これは一般の人々にとって、アカデミアにとって、ビジネスにとって、そして将来の社会にとって何を意味するのでしょうか?多くの未知の部分があります。これは前例のないことです。全て新しいことなので、考えるべきことが多くあります。
たとえ明日AGIが実現したとしても(明日とは思いませんが、2030年までには確実に、おそらくそれより早く実現するでしょう)、社会にとって何を意味するのでしょうか?多くの意味があります。
一つは、それは瞬間的には起こらないということです。AGIが完全に実現したから全てが一度に変わる、というわけではありません。異なるセクターや領域で徐々に変化が始まり、あるセクターで雇用が失われ始める一方で、別のセクターには全く影響がないかもしれません。
私たち社会はこれらのことを考慮する必要があります。全ての社会に影響を与えているわけではないため、政治家や規制当局は本当の意味での反応を示さないかもしれません。全てが非常にゆっくりと進んでいるからです。
私たち社会とアカデミア、そして全ての人々は、これを理解し、研究し、そして主張する必要があります。「このグループに影響を与えていますが、他の全てのグループにもすぐに影響を与えるでしょう。だから今すぐ行動を起こす必要があります。今すぐ解決策を見つける必要があります。」
私は経済的な側面とAIの未来、そして私たちができる可能性のある対策について、別の動画を作る予定です。しかし、これは単なる経済の問題ではありません。人々の生活、彼らの価値、彼らは何をするのか、私たちはどのように充実感を得るのか、そして人々が互いにどのように関わり合うのかということにも影響を与えます。
AIがAGIを持ち、人間と同じ知能と能力、感情的つながりを持つとすれば、人間との関係が発展するでしょう。それは適切なのでしょうか?それは問題ないのでしょうか?どこまでが許容されるのでしょうか?
AIとAGIに関しては、関係する全ての人に影響を与える様々な側面があります。お金の側面もありますが、学校については何をすべきでしょうか?同じことを教え続けるべきでしょうか?私たちは学生を何のために準備しているのでしょうか?
特に、特定のセクターに注目する必要があります。AIが完全に引き継ぎ、そこに仕事がなくなるセクターがあるとすれば、なぜ私たちはまだそれらの分野で学生を卒業させているのでしょうか?一歩下がって、本当にこれらのことを見直す必要があります。
そうですね、それを完全に減速させるか排除する必要があります。ここに集中するか、将来実際に仕事があり、学生が成功できるような新しいプログラム、新しいものを考える必要があります。「目を閉じて、やりたいことは何でもどうぞ」というのではなく、より前向きに、より目的を持って、アカデミアで将来の成功を確実にするために何ができるかを本当に考える必要があります。
ここには多くのことが関係しています。私にはすべての答えはありませんが、私が望むのは、私たちがこれについて考え、議論し、大学や高校などのアカデミックな場、公の議論、ビジネス、政策、政治家、あらゆる種類の政府に、これを持ち帰ることです。私たち全員がこの議論を行い、これが何を意味し、みんなが仕事を失い、社会に様々な問題が生じるのを防ぐために、より良い未来をどのように確保できるかについて、前を向いて考える必要があります。
これらの会話を通じて、私たちは前進することができます。皆さんのコメントを読み、私たちが一緒に何を思いつくか楽しみにしています。お時間をいただき、ありがとうございます。そして、学びは人生のためにあることを忘れないでください。