見出し画像

ヤン・ルカンとジョン・ワーナーが語る次のAI革命:オープンソースとリスク | IIA ダボス会議2025

9,243 文字

ヤン、今はAIにとってエキサイティングな時期ですね。どうお感じですか?
そうですね、とてもワクワクしています。25歳くらいの時に感じていたような興奮を覚えています。それ以来、こんなに興奮したことはありませんでした。それは産業界の動向というよりも、主に研究の面からです。ここ数年でAIに革命が起きましたが、これから3~5年の間にまた新たな革命が起こるでしょう。それは私が取り組んできたことで、次のステップなのです。これから数年で何が起こるのか、とても楽しみにしています。
では、この対話を6つのパートに分けたいと思います。まず最初のパートとして、そのインスピレーションとキャリアについてお聞きしたいと思います。人工知能、拡張知能、あるいは環境知能とも呼ばれていますが、これらへの関心のきっかけは何だったのでしょうか。私はミンスキーが住んでいた家の近所に住んでいます。彼は既に亡くなりましたが、私が彼の家を訪ねた時、なぜAIと呼んだのかと尋ねました。彼は1955年にマッカーシーと共に政府に論文を提出し、サイバネティクスを研究する人々をダートマスに集めて考えを深めるための資金を要請したそうです。彼は私に「ジョン、BIと呼ぶこともできたけど、AIの方が怖そうで政府がお金をくれると思ったんだ」と言いました。
あなたはどのようにしてAIの分野に入られたのでしょうか。また、キャリアはどのように発展してきたのでしょうか。ここにいる若い人たちのキャリアについても考えていただきたいと思います。また、AIの進展により、あなたのようなキャリアの積み方と、これからのキャリアの積み方がどのように異なってくると思われますか。
それは本当に長い話になります。マーヴィン・ミンスキーが関係していますね。私は子供の頃から科学に興味があり、特に動物や人間における知能の発現について魅了されていました。9歳の時に両親に連れられて「2001年宇宙の旅」を観ました。そこに知的なコンピュータが登場し、そんなコンセプトが可能だとは知りませんでした。実は、その映画の科学顧問がマーヴィン・ミンスキーだったんです。
学部生の時、人々が学習できる機械について研究していたことを知りました。私は自分が十分賢くないので、最初から知的な機械を設計することはできないと思っていたので、学習は知能の本質的な部分だと考えていました。自然知能も同様です。
その後、別のMIT教授の論文に出会いました。セイモア・パパートです。タートルのロゴの前に、彼はスイスの実験心理学者・発達心理学者のジャン・ピアジェと共に仕事をしており、言語は生得的なものか学習されるものかについてのピアジェとチョムスキーの議論を収めた本の中で論文を書いていました。そこでパーセプトロンについて語っていました。これは50年代に開発されたモデルです。
学習機械という考えに完全に魅了され、文献を掘り下げ始めました。当時は電気工学の2年生か3年生でした。それに情熱を持ち、様々な教授と独自の研究プロジェクトを行い、その後大学院に進みました。
文献を探していた時、ミンスキーとパパートが60年代後半に分野全体を潰してしまった本を発見しました。AIの冬ですね。70年代には古典的な論理ベースのAIと機械学習ベースのAIの両方で冬の時代がありました。それが80年代に復活したのです。
もしデロリアンで過去に戻れるとして、冬の時代が始まろうとしている彼らに何を囁きますか?深い意味や時宜を得た興味深いことはありますか?
若い頃の彼らの関心事である自己組織化する学習機械が正しい道筋だったということです。彼らはそれを放棄し、基本的に他の全ての人々にも放棄するよう説得してしまいました。それは少し間違いでした。実際にマーヴィン・ミンスキーと一度議論したことがありますが、私はまだとても若い学生でした。彼は「それを殺すことは良かった。なぜなら、そうでなければ生まれなかった他のものを発明するきっかけになったから」と言い、それはある意味正しかったのです。
初期の進化型ニューラルネットの研究は、その後の研究の方向性にどのような影響を与えましたか?
多くの人が私が畳み込みニューラルネットを研究していたと思っていますが、それは80年代後半のベル研究所での話です。実際にはトロント大学のパット・アンダーソンのところで始めました。クロード・シャノンについて...彼はもうそこにはいませんでしたが、MITで一輪車に乗っていましたね。その頃には既にMITを退職していました。
人々は私が文字認識に興味があると思っていましたが、全くそうではありません。私は知的な機械を作ることに興味があり、そこから逆算して作業を進めていました。知的な機械を作りたいけれど、ゼロから考え出すほど賢くないので、機械は学習を通じて自分自身を構築する必要があります。では、機械にどうやって学習させるか?60年代に人々はこれに取り組みましたが、技術は非常に限られていました。
当時、明らかだったのは、基本的に1層以上のシステムを訓練できないことが制限要因だということでした。そこで、複数の層を持つシステムをどのように訓練できるかを研究し始めました。今では深層学習と呼ばれているものです。そして、現在ではTarget Propと呼ばれるルールを発見しましたが、これはバックプロパゲーションと非常によく似ていました。
そこから、学習アルゴリズムができたら次の疑問は、それらのニューロンをどのように接続して有用なことをさせるかということでした。80年代当時、アクセスできるデータは文字か、スキャンしたものだけでした。当時はUSBカメラをコンピュータに接続することすらできませんでした。実際、画像をコンピュータに取り込むのは大きな仕事で、ほとんどが白黒でした。
当時、まともなサイズで利用できるデータセットは、文字認識か音声認識のどちらかだけでした。音声認識には既に多くの人が取り組んでいました。印刷された文字の認識は上手くいっていましたが、手書きはそうではありませんでした。私がこれに取り組んだのは、そこにデータがあったからです。
実際に90年代半ばには小切手や様々な文書の読み取りに展開されました。これは素晴らしいことで、教訓があると思います。非常に野心的な長期的目標を設定し、そこから逆算して作業を進め、最初のステップを踏み出すと、通常その最初のステップが有用で、AIへの道のりの中で比較的短期的な成果が得られるのです。
それ以来、私はその道筋に沿って進歩を続けようとしてきました。そして、メタのマーク・ザッカーバーグやCTOのマイク・シュレーファーなどに、産業界での研究をこのように組織すべきだと説得しました。非常に野心的な目標を持ち、そこから逆算して作業を進めれば、必然的に良いものが生まれてくるのです。
では、これからの展開を予告させてください。AIの研究と進歩について質問をし、次に課題と機会について質問し、そしてメタとFAIRについて質問し、最後に倫理と責任、そしてアドバイスと遺産について質問したいと思います。あなたは私の大好きなチューリング賞受賞者です。
18分ありますので、3つの簡単な質問をします。パスするか、簡潔に答えてください。ヨシュア・ベンジオとジェフリー・ヒントンとの経験は、あなたの研究興味をどのように形作りましたか?そして生成AIの新しい波により、AIについてのあなたの見方は何が変わりましたか?
ジェフは私のメンターで、多くの面で尊敬しています。博士課程を始めた時、彼は私が世界で最も会いたかった人でした。なぜなら、多層訓練や隠れユニットなどの問題を理解していたことを知っていたからです。1985年に出会い、1986年にも再会しました。彼は私にポスドクのポジションを提供してくれました。私はとても嬉しく、1987年から88年にかけてトロントで彼と一緒に研究しました。
モントリオールで講演した時、とても知的な質問をした若い修士課程の学生がいました。それがヨシュア・ベンジオでした。その後、ベル研究所にいた時、ヨシュアをまずポスドクとして、その後研究者として採用しました。それ以来、ほぼ40年近く断続的に一緒に仕事をしています。
お互いに多くの尊敬を持っていますが、いくつかの話題については本当に意見が合いません。その一つがAIの実存的リスクです。ジェフはこれについて完全に間違っていると思います。ヨシュアもかなり間違っていると思います。私たちは友人として意見が合わないのです。
生成AIの新しい波について、AIに関するあなたの見方は何が変わりましたか?一文で答えてください。
生成AIには約3年の寿命があります。皆が生成AIに興奮していますね。生成AIとは何でしょうか?基本的に、シーケンスの次に何が起こるかを予測するようにシステムを訓練することです。テキストやDNAシーケンス、離散的なシンボルのシーケンスに対してはとてもよく機能します。
しかし、生成したいものが離散的でなく連続的な世界にある場合は異なります。この学習のパラダイムは自己教師あり学習と呼ばれます。入力と出力があるのではなく、全てが入力であり出力です。システムを訓練して、入力の一部から他の部分を予測させます。
例えば、ビデオを予測することで世界を理解するようにシステムを訓練するというアイデアは非常に古く、私を含めて多くの人々が過去20年近く取り組んできました。猫のビデオだけではありません。訓練には多様性が必要です。
しかし、これは機能しません。テキストではとてもよく機能しますが、ビデオでは機能しません。その理由は、テキストでは次の単語を予測できますが、可能な全ての単語の分布を予測する必要があるからです。ビデオに関しては、この表現方法がわかっていません。
結論を言うと、唯一の方法は生成モデルを完全に捨て去り、ビデオの抽象的な表現を学習し、この抽象的な表現で予測を行うシステムを訓練することです。これがJAPAと呼ばれる結合埋め込み予測アーキテクチャで、基本的に生成モデルを一掃することになるでしょう。
過去10年間でAI研究における最も重要なブレークスルーは何だと考えますか?深層学習モデルをより大規模なデータセットやより複雑なタスクにスケールアップする際の主要な課題は何ですか?そして、複雑な構造化データを扱うグラフニューラルネットワークはどのように進化すると考えますか?
最初の質問、過去10年間のAIにおける最も重要なブレークスルーについては、確かに深層学習システムを構築するためのモジュールを組み立てることを可能にする建築的概念です。トランスフォーマーは間違いなくとても有用で実り多い建築的概念でした。これらは畳み込み層が並進に相当するように、分割に相当します。おそらく、これに似た新しいものが出てくるでしょう。
自己教師あり学習は、おそらく最も革新的な概念で、過去10年間で機械学習の実践方法を完全に変えました。また、連想メモリで拡張されたシステムなど他のものもありますが、その方向でさらなる進歩が期待できます。AGIは本物だと思いますか?それとも詐欺でしょうか?皆が言うほど近いのでしょうか?あなたの立場を教えてください。
AGIは誤称です。これは実際には人間レベルのAIを指しています。人間の知能は非常に専門的なので、これを汎用知能と呼ぶのは完全にナンセンスです。メタでは、これを先進機械知能(AMI)と呼び、フランス語で「友達」を意味するAmiと発音しています。
AGIという言葉は好きではありませんが、将来的に人間が知的である全ての領域において、人間と同じくらい知的なシステムができることは間違いありません。知能が一次元的なスケールだという考えも、またナンセンスです。猫は特定の面であなたより賢く、あなたは他の面で猫より賢いのです。チェスであなたに勝つ30ドルや30ユーロのガジェットは、チェスに関してはあなたより賢いのです。
それが一次元的なスケールで、ある時点でAGIに到達するという出来事があるという考えは完全なナンセンスです。それは段階的に進んでいくでしょう。大規模言語モデルにはできない物理的世界の理解、持続的なメモリ、推論と計画の能力など、これらが今後数年間のAIにおける4つの課題です。これが私が取り組んでいることであり、メタのFAIRの半分がこれに取り組んでいます。これが次世代のAIシステムです。
AIの機会について、AGIについてのあなたの考えを伺いましたが、どのようにすればAIが背景や社会経済的地位に関係なく、全ての人々の利益になるようにできるでしょうか?今は野放し状態で、ツールを作ればいいという感じです。Web2.0の時代は勝者総取りで、プライバシーは窓から投げ捨てられ、メタやフェイスブック、グーグルは本当にうまくやりました。このAIの時代には、本当に何かを組み込む機会があると思います。Uberはウェブ2.0の16年後になってようやく「これらを組み合わせることができる」と気づきました。今起きているこの技術と組み合わせられるものがたくさんあると思います。
平等化する機会についてどう思われますか?
2つの言葉で答えましょう。オープンソースです。
オープンソースにはどのように関わるようになったのですか?彼らがリクルートしてこれをやってほしいと言ったのですか?それともメタに来てこれをやると言ったのですか?
ほぼそんな感じです。マークとCTOだったマーク・シュレーファーに、メタ(当時のフェイスブック)でAIの研究活動を立ち上げるようリクルートされた時、私は3つの条件を出しました。
1つ目はニューヨークから移動せず、カリフォルニアには行かないこと。2つ目はアカデミアとの繋がりが必要なのでNYUの仕事は続けること。3つ目は、私たちが行うことすべてをオープン研究とオープンソースにすることです。
最初の2つの質問への答えはイエスで、3つ目の質問に対しては「心配する必要はない、それは会社のDNAの一部だ。私たちは既にReactなどのプラットフォームソフトウェアやOpen Computeなど、全てをオープンソース化している」という答えでした。
「それなら心配ない、どこにサインすればいいですか」と言いました。これは、以前に面接したり働いたりした会社から初めて聞いた回答でした。そこが最も興味深い側面だと思いました。
私たちはオープン研究を実践し、それはグーグルなど他の研究所にも影響を与え、彼らも少し開放的になりました。グーグルブレインは論文を発表していましたが、それほど多くはありませんでした。
これが過去12年間のAIの急速な発展を引き起こした大きな要因の一つです。科学的情報やコードなど、全てが自由に交換されることで、全てが加速されたのです。
これはメタの経営陣にとって、世界のためだけでなく、業界全体と私たち自身にとっても本当に良いことだという大きな証拠となりました。私たちはたくさんのフィードバックを得て、人々が私たちのツールを使うことからイノベーションのフライホイールが生まれています。
そのため、私たちはPyTorchをオープンソース化しただけでなく、所有権をLinux Foundationに移転しました。PyTorchは今や、OpenAIを含めほぼ全てのAI研究開発の基盤となっています。TorchRTPはPyTorchの上に構築されています。
しかし、もっと重要な理由が2つあります。1つ目は、今日のAI産業は主にオープンソースの基盤モデルの上に構築されているということです。多くのスタートアップがLlaMAやMistralなどのオープンソースエンジンの上に構築されています。これらのオープンソースプラットフォームがなければ、今日私たちが知っているようなAI産業は存在しなかったでしょう。
2つ目は、将来的にデジタル世界との全ての相互作用がAIアシスタントによって仲介されるということです。スマートフォンやこのメガネのようなスマートデバイスから...皆さんの写真を撮ることができますよ、笑ってください。
つまり、私たちの全ての情報の摂取がアシスタントを通じて行われることになります。これを米国西海岸や中国の一握りの企業からのアシスタントに任せることはできません。高度に多様化される必要があり、それを実現する唯一の方法が、ローカルなアプリケーションや世界中の言語、文化、価値観のシステムに合わせて微調整されるオープンソースの基盤モデルなのです。
これが、多様なAIアシスタントの集団が必要な理由で、多様なプレスが必要な理由と同じです。民主主義を守るため、オープンソースを維持し、法制化によって消滅させないことがとても重要です。
よく言っていただきました。5年前、今起きていることが起こると思っていましたか?マイクロソフトリサーチのセバスチャンと話しましたが、彼は5年前、今起きていることは90年後に起こると思っていたそうです。彼は非常に感情的になり、自分の子供が使うことになるものが、次の世代になると思っていたと言いました。あなたは物事は予想通りに進んでいますか?少し先を行っていますか?それとも何が違いますか?
5年前には、対話システムや言語の文脈における自己教師あり学習が大きな影響を与えることは明らかでした。ChatGPTが誰の目にも触れていなかったので、一般の人々にとっては明確ではありませんでしたが、メタやグーグル、OpenAI、その他の組織で開発されていたシステムを見れば、どこに向かっているのかは明らかでした。
セバスチャンは面白い人物です。非常に理論的な数学的バックグラウンドを持ち、マイクロソフトリサーチの理論グループの責任者でした。彼は機械学習に抵抗がありました。理論的に複雑すぎて面白くないと思っていたのです。しかしある日、GPT-4で遊んでいて大きな啓示を受け、「わあ、これは本当にすごい」と言って、AGIの兆しについての論文を書きました。そしてマイクロソフトを辞め、今はAnthropicで働いています。
彼はその論文をオンラインで公開した日に私と一緒にいて、非常に感情的でした。啓示の前後の両方の意見が極端すぎたと思います。
最後の質問は、人々が知らないが重要だと思うことや、あなたの視点からユニークなことを話していただきたいと思います。現在のAI界におけるあなたの遺産は何だと思いますか?それが私の最後の質問ですが、その前に、AIは怖いと思います。高度なAIシステムの潜在的なリスクや欠点は何で、それらをどのように緩和できるでしょうか?私はテクノオプティミストですが、課題を認識する必要があると思います。遺産についてお話しいただく前に、そしてこの皆さんに内部の情報をお伝えいただく前に、それについてお聞かせください。
リスクと利益についてお話ししましょう。利益はリスクをはるかに上回ります。経済成長だけでなく、科学や医学の進歩、安全性など、あらゆる面での利益があります。しかし、最も重要なのは、AIによって誰もが賢くなるということです。
常に私たちと共にいるAIアシスタントと一緒に歩くことで、彼らは私たちの知性を増幅させ、私たちのために働きます。私たちを支配したり殺したりすることはありません。私たちの指示に従って働くのです。ただし、この部屋にいる誰よりも、私を含めて誰よりも、より賢い方法で問題を解決するかもしれません。
私たちは自分より賢い人々と働くという概念にとても慣れています。これがこれから起こることです。仮想の人々からなるスタッフが、あなたのために働き、彼らはあなたより賢く、あなたをより生産的で創造的に、より賢くし、人間の知性を増幅させるのです。これは私たちができる最高のことだと思います。
最後にこれが大規模に起こったのは、印刷機の発明の後でした。知識と哲学の普及を可能にし、基本的にヨーロッパの封建制度を崩壊させ、啓蒙主義をもたらし、アメリカ革命やフランス革命、民主主義の出現を引き起こしました。これは非常に大きな影響を与えました。知識の普及だけでこれほどの影響があったのです。
AIは同じような効果を持つかもしれませんが、次のステップです。おそらく人類にとって新しいルネサンスとなるでしょう。遺産についてはどうでしょうか。
よく言っていただきました。あと数分ありますので、思っていることを話してください。デミスは今、別の場所でランチをしていると思います。私たちの方が大きなグループですね。世界のリーダーたち、企業の人々、技術者たち、MITコミュニティがいます。私たちは何を知る必要がありますか?これがあなたの舞台です。
まず第一に、AIは私たちを殺すことはありません。将来のAIシステムは現在のものとは全く異なる設計図に基づいており、ある意味でより安全で制御可能になります。
私が提唱しているのは、目的駆動型AIと呼ばれるものです。基本的に、ガードレールに従いながら目的を最適化することで答えを導き出すAIシステムです。これにより、システムは制御可能になります。大規模言語モデルは制御可能ではありません。目的を最適化せず、ただ1つのトークンを次々と生成するだけです。
将来のシステムはより賢く、推論が可能で、願わくは物理的世界を理解し、常識を持つようになりますが、これらのガードレールと目的のおかげで制御可能です。これらのガードレールを設計することは、特に難しくも珍しくもありません。
私たちは人間や超人的な存在である企業と、法律を作ることでこれを行っています。その仕組みはわかっています。
つまり、私たちを殺すことはありません。将来のシステムは現在のものとは全く異なります。これらのパラダイムの変化により、今後3~5年以内にAIにまた革命が起こります。これにより、司法試験に合格したり数学の問題を解いたりするだけでなく、猫ができることもできるようになるかもしれません。
猫がどのようにしてそんなに早く賢くなり、私たちが作れるどんなロボットよりもはるかに優れた世界理解を得られるのか、私たちにはわかりません。もしこの謎を解き、物理的世界を理解し、常識を持つことができれば、家庭用ロボットやレベル5の自動運転車(これはまだ存在しません)を動かすシステムを手に入れることができます。
そして、私たちが想像してきた全てのものが実現するでしょう。次の10年が、次世代AIシステムに向けた一歩を踏み出せれば、ロボット工学の10年になるかもしれません。

いいなと思ったら応援しよう!