20歳の若者へのヤン・ルカンからのアドバイス：長く使える基礎的な分野を学びなさい

2024年10月30日 07:41

7,177 文字

はい、マネーコントロールをご覧の皆様。本日はAIの先駆者の一人で、よくAIの生みの親の一人とも呼ばれ、現在メタのVP兼チーフAIサイエンティストを務めておられるヤン・ルカン博士にお越しいただきました。ヤン先生、本日はマネーコントロールにお時間をいただき、ありがとうございます。
先生は今回で3回目のインド訪問、バンガロールは2回目とお聞きしましたが、2020年1月以来、パンデミックを除いて、どういった変化があったんでしょうか。
「そうですなぁ。最初にバンガロールを訪れたんは2011年でした。まだディープラーニング革命の前でしたわ。近くのタタ研究所で科学ワークショップに参加しましてん。当時は科学界でAIがどう進んでいくかについて大きな議論があった時期でしたわ。ディープラーニングが注目される前やったんです。
その後、パンデミック直前の2020年初めに再訪しました。その頃にはAIは既に離陸してましたが、主にコンピュータービジョンや音声認識、音声合成、自然言語処理の分野での応用が中心でした。大規模言語モデルやチャットボットの概念はまだ本格的に出てきてなかったんです。
学生さんや技術者、アカデミックなコミュニティ、そしてある程度はテック業界からもAIへの大きな期待がありましたけど、今日では完全に爆発的な状況になってますわ。ホテルのロビーで数分立ってるだけでも、『ルカン教授、写真撮らせてください』とか『AIのスタートアップやってます』とか『メタが公開してるLLamaを使ってます』とか声をかけられるんです。
インドでも他の国でも、こんな感じで爆発的に広がってきてますわ」
「先ほどステージでナンドさんと一緒におられた時、インドはLLMの開発に時間を費やすべきではなく、ユースケースに注力すべきだとおっしゃってましたね。これについてはインドでかなり議論があって、一方では『なぜインドは基礎的な技術を構築してフルスタックを所有しないのか』という意見もあります。この点について、インドはどういうアプローチを取るべきだとお考えですか？AIユースケースの中心地を目指すべきか、それとも主権の観点から基礎技術の開発にも理由があるのでしょうか」
「現時点では、オープンソースの基盤モデルを使うのが正しいアプローチやと思いますわ。今やLLaMA 3.2が最高のモデルですから、それを使って、インドの700以上ある言語に対応させたり、音声活性化システムを作ったりして、誰もがアクセスできるようにするのが賢明でしょうね。
消費者向けにもビジネス向けにも、すぐに展開できる垂直アプリケーションがたくさんありますわ。
中期的に見ると、基盤モデルのトレーニングは複数の地域に分散されていくと思います。その理由として、まずモデルのトレーニングコストが膨らんでるということがありますわ。
次に、世界中の言語に対応する基盤モデルが必要になってきますが、メタのような単一の組織では世界中のデータにアクセスできへんのです。これは一部には、地域がそれぞれのデータに対する主権やコントロールを求めてるからです。
そして三つ目は規制の問題です。様々な理由でデータを国外に出したくない国もあります。
つまり、私たちが向かってるのは、AIが本質的に共有プラットフォームになる世界です。分散した形で訓練され、最高のオープンソースAIモデルが人類の知識全体を取り入れるような形になっていくと思います。
そのシステムの上で垂直アプリケーション向けに微調整されていくわけですが、基本モデルは今よりもずっと汎用的になり、例えば英語に偏重することも少なくなるでしょうね」
「AIは底辺への競争になってきてませんか？毎週新しいモデルが登場して、トークンあたりの価格は100分の1くらいまで下がってきてますよね。この状況をどうご覧になってますか？AIの販売は米の販売みたいなコモディティになってしまうんでしょうか？」
「はい、そうでもあり、そうでもないですわ。インターネットやモバイル通信システムのソフトウェアスタックの歴史的な進化と似たようなコモディティ化が起こると思います。
25年前くらいは、ソフトウェアスタックのほとんどが独自仕様でした。マイクロソフトやサン・マイクロシステムズ、オラクルなどが基本的なソフトウェアコンポーネント、つまりオペレーティングシステムなどを提供してました。
でも、それは全て消えましたわ。今では全てがオープンソースプラットフォーム、Linux、MySQL、Apacheウェブサーバーなどで動いてます。インターネット全体がオープンソースで動いてるんです。モバイル通信システムもオープンソースのスタックで動いてます。
あまり知られてませんが、あなたの車もLinuxで動いてます。携帯電話もおそらくLinuxですわ。
AIも同じような現象が起こると思います。AIは共通のプラットフォームになっていくので、オープンソース化は歴史の必然やと考えています。多くの貢献がなされることになるでしょう。
加えて、実行コストを底辺まで下げる必要があります。AIアシスタントへの広範なアクセスを実現するためです。将来、私たちは皆スマートグラスをかけて、AIアシスタントと会話することになるでしょう。インドの農村部の人々も含めてです。
例えば、畑仕事をしながら『今植えるべきか、もう少し待つべきか』と考える時に、アシスタントに相談できる。学校の子どもたちもAIシステムから個別指導を受けられる。そのためには本当に安価である必要がありますわ。ですから、価格が大幅に下がって、100万トークンあたり数ルピーくらいになることを期待してます」
「また先生は、人間レベルの知能を目指すなら、LLMや生成モデルの構築に焦点を当てるべきではないともおっしゃってましたが、それはなぜでしょうか？」
「LLMは素晴らしく、非常に有用ですわ。しかし、それ自体では人間レベルの知能を持つAIシステムには至りません。言語を操作するのは非常に得意で、司法試験に合格したり、エッセイを書いたりできます。
でも、家庭用ロボットはどこにありますか？完全な自動運転車は？17歳か18歳の若者のように20時間の練習で運転を覚えるシステムは？
10歳の子どものように、テーブルを片付けて食洗機に入れる方法を理解できる家庭用ロボット、何百人もの技術者による設計を必要とせずにそれができるロボットはどこにありますか？
物理的な世界の理解を必要とするこの種の知能は、まだ存在しないんです。これは私たちがメタのFAIR（基礎AI研究所）で構築しているものです。FAIRはメタの長期的な基礎AI研究部門で、次世代のAIシステム、つまりLLMを超えて、世界を理解し、永続的な記憶を持ち、計画や推論ができるシステムの開発に取り組んでいます。
現在のAIシステムにはこれができません。これは今後5年から10年の大きな課題になるでしょう」
「先生は有名な発言で『家庭猫の方がAIより賢い』とおっしゃいましたが、本当にAIは猫や子供のように賢くなる必要があるんでしょうか？現在のAI開発でも、コンテンツ作成や顧客サポート、健康記録の分析など、少なくとも下位レベルの仕事は置き換えられつつありますよね。人間レベルのAIが必要な理由は何で、そういう世界に私たちは準備ができているんでしょうか？」
「確かに仕事は置き換えられてますが、それは主に仕事の変革なんです。それぞれの仕事で人々の生産性を高め、活動の焦点を変えているんですわ。仕事が消えるというよりは、新しい仕事が生まれてきてます。AIの影響で10年後にどんな仕事が人気になるかを予測するのは非常に難しいですね。
人間レベルのシステムが必要な理由は、私たちの日常生活を常にサポートし、問題を解決してくれるアシスタントが必要だからです。ビジネスや学術界、政府のリーダーが、スタッフの助けを必要とするのと同じです。私たちは全ての問題を自分で解決できるわけではありません。
実は、自分より賢いスタッフと働くのは非常に力強い経験なんです。最終的に私たちは、自分より賢い仮想的な人々であるAIアシスタントを持つことになります。これは私たちにとって力を与えてくれるものになるはずです。
私たちがボスとして指示を出し、どの問題を解決すべきかを伝え、AIアシスタントがそれを解決してくれる。これを脅威に感じる必要はありません。むしろ私たちをより生産的に、より力強くしてくれます。誰もがスタッフのボスになれるようなものです。
これは社会に信じられないような影響を与えるでしょう。誰もがより賢くなれるからです。才能と知性は、私たちが最も欠いているものです。
面白いことに、平等化効果があるかもしれません。仕事が得意な人はAIによってちょっとだけ良くなり、あまり得意でない人は大きく改善される傾向が見られます。これは一種の平等化効果をもたらす可能性があります。
だからこそ、多様な人々がAIにアクセスできることが重要で、AIシステム自体も多様である必要があります。アメリカ西海岸の2、3の独占的なAIシステムだけを選択肢として持つのは望ましくありません。メディアの多様性が必要なのと同じように、AIシステムの幅広い多様性が必要なんです」
「多様性と言えば、インドは多様性のあるAIモデルの構築でどんな役割を果たせるでしょうか？言語の大規模なデータセット、多くの下位文化、そして既に福祉制度、本人確認、リアルタイムのデジタル決済をサポートしている大規模なデジタル公共インフラがありますが」
「インドが構築したデジタル・インフラストラクチャーについて言えば、非常に低コストの5Gアクセスなど、かなり印象的ですわ。決済などの認証技術も、基盤は既に整ってます。大規模に提供できる専門知識を持った人材もいます。
インドの開発者たちは既に、垂直アプリケーション向けのオープンソース・プラットフォームの微調整や適応で重要な役割を果たしています。今朝参加したイベントでも、本当に印象的なことをしているスタートアップをたくさん見ました。ハッカソン参加者の中で最も興味深い取り組みに賞を贈りましたよ。
既に多くのことが起きていますが、もっと重要なのは、インドが研究コミュニティにおいてより大きな参加を果たすことやと思います。エンジニアリングや製品開発だけでなく、研究も重要です。
他の国々でその効果を見てきました。特にフランスでは、10年前にFAIRパリを設立しましたが、これは地域のエコシステムに大きな影響を与えました。フランスは今や世界で2番目に大きなAI大国になりましたわ。
それは私たちがその研究所を作ったからです。心理的な効果は絶大でした。将来のキャリアに迷っていた学生たちに北極星を与えたようなものです。『ああ、AIはかっこいい。フランスに残ってキャリアを築ける可能性がある』と。
この研究所の存在がきっかけで、Googleも研究所を作り、フランスの企業もそれに続きました。エコシステムを作り出し、キャリアの展望を開いたんです。学生たちは金融ではなくAIの博士課程に進むようになりました。それが一番かっこいいことになったんです。
FAIRパリはフランスの大学と協力して、毎年十数人のAI博士を輩出しています。FAIRの人々と大学の共同指導で学んだ学生たちです。その中の何人かは私たちがFAIRで雇用しましたが、ほとんどはエコシステムに入って起業したり、開発に参加したりしました。
だから今、パリのエコシステムについて耳にするようになったんです。インドも同じことができると思います。おそらく南インド、バンガロールを中心に。昨日マドラスにいましたが、他の場所でも可能性はあります」
「先生はメタのグラスをお使いですが、日常的にどのように使われているのか、また長期的にAIがどのようにフォームファクターを進化させていくとお考えですか？」
「写真を撮ることができますわ。『ヘイ、メタ、写真を撮って』と言えば写真が撮れます。ビデオも撮れます。
まだ全ての地域で展開されていませんが、例えばカンナダ語で書かれたメニューを見ると、Googleレンズのようにリアルタイムで翻訳してくれます。でも、それがメガネの中でできるんです。骨伝導で声が聞こえてきます。
音楽も再生できます。私はほとんどいつも着用していて、仕事場まで歩く時も音楽を聴いたり、メッセージを確認したりしています。メタに質問することもできます」
「ルカン博士、同じチューリング賞受賞者のヒントン氏やベンジオ氏と比べて、AIの悪影響についての見方が非常に異なりますよね。彼らはAIの破滅論的な側面を懸念していますが、先生はテクノ楽観主義者というか、AI楽観主義者ですよね。なぜそう考えるのか、また規制やバランスは必要ないとお考えですか？」
「製品の展開については、AIを使っているかどうかに関係なく、確かに規制は必要やと思います。例えば、運転支援システムを車に搭載する場合、どんな技術を使っているかに関係なく、政府機関がシステムの安全性を確認する必要があります。
医療画像分析システムについても、最新のAI技術を使っているかもしれませんが、臨床試験を行い、政府の承認を得る必要があります。生命に関わる用途については、ほとんどの規制が既に整っています。
議論になっているのは、AI研究開発に規制が必要かどうかです。私は研究開発には規制をかけるべきではないと強く考えています。研究開発の規制を支持する人々は、製品化しなくてもAIは本質的に危険だと考えています。
十分に強力なシステムが構築されると、事故で悪用される可能性があったり、単にそれを起動すること自体が人類にとって危険になり得るという考えです。私はこれを全く信じていません。SF的な発想で、本当のことを知らない人々か、現在のAIの能力を過大評価している人々の考えだと思います。
私の同僚であり友人でもあるヨシュア・ベンジオやジェフ・ヒントンは異なる見方をしています。彼らは民主主義制度が技術の進化を最大限に活用できる能力について、私ほどの確信を持っていません。もう少し否定的で懐疑的なんです。
気候変動の状況を見て、『利益だけが動機付けになると、良くないことが起こる』と考えています。私の方がずっと楽観的です。何をすべきかを決めるのは民主主義の役割だと思います。
ただし、研究開発を規制したり、オープンソースAIプラットフォームの普及を妨げたりするべきではありません。それは非常に危険で、規制の捕捉を招き、AIシステムの提供者が少数の大企業に限られてしまう可能性があります。そうなってはいけません。AIは広く分散され、誰でも利用できるオープンソースのインフラでなければなりません」
「AMI（人工的な一般知能）までどのくらいの距離があるとお考えですか？」
「私が先ほど話した考えの効果は、うまくいけば3年以内には見え始めると思います。動物のように現実世界から学習できる機械が5、6年、あるいは7年以内に実現できる良い道筋に乗れるでしょう。そして10年以内には人間レベルのシステムへの道が開けるかもしれません。
ただし、分布には長いテールがあります。つまり、予想していない障害に突き当たって、もっと長くかかる可能性もあります。AIでは常にそうでした。新しい技術や新しいパラダイム、新しい手法が登場すると、コミュニティは『これだ！これを拡張すれば人間レベルのAIができる』と考えます。
今、人々はLLMについてそう考えていますが、それは間違いです。以前の世代のAI技術についても同じように考えていて、それも間違っていました。私も間違っているかもしれません。私たちが考えている以上に難しい可能性は確かにありますわ」
「最後の質問です。現在の状況を踏まえて、AIが至る所にあって、その破壊的な変化のペースについていくのが難しいと感じている10歳、20歳、30-40歳の人々へのアドバイスをお願いします」
「10歳の子どもには問題ありません。AIと一緒に育っていくので、AIは当たり前の存在になります。完全に自然なものです。
20歳の人は『どんな専門分野を学ぶべきか』『AIシステムの方がプログラミングが上手くなるのに、コンピュータサイエンスを学ぶ価値はあるのか』と考えるでしょう。いいえ、それは間違いです。
長く使える基礎的なことを学ぶべきです。数学、物理学、基礎的なコンピュータサイエンス、応用数学などです。これらは次世代のAIシステムを理解し開発するために必要になります。
AIはそれらを学ぶのを助けてくれますし、それを使って仕事をするのも助けてくれます。でも基礎は学ぶ必要があります。モバイルアプリ開発のようなコースと、量子力学を学ぶ選択肢があるなら、モバイルアプリの寿命は3年くらいですから、量子力学を学びなさい。これが私の推奨です。長く使える知識を学んでください。
30-40歳の人たちには、世界は大きく変わっていくということを理解してほしいです。自分が大きなものになると思うことに全てを賭けないでください。3-5年で技術は完全に変わります。現在よりもずっと大きな能力を持つようになるでしょう。だから、技術の行方についての仮説に縛られるような選択はしないでください」
「その言葉で締めくくりたいと思います。ルカン博士、本日はマネーコントロールにお時間をいただき、ありがとうございました。
ご覧いただいていたのは、ヤン・ルカン博士とのマネーコントロールのインタビューでした」

20歳の若者へのヤン・ルカンからのアドバイス：長く使える基礎的な分野を学びなさい

いいなと思ったら応援しよう！