[ダボス会議のOpenAI ]スターゲート、o3リリース、 ヒューマノイド、そして収穫加速の法則について
現在、スイスのダボスで開催されているダボス会議(WEF:世界経済フォーラム年次総会)の会場内で行われたウォルストリートジャーナルのOpenAIのチーフ・プロダクト・オフィサー(再構成品責任者)のケビン・ワイル氏へのインタビュー内容を紹介します。
同氏からは、昨日、トランプ大統領がホワイトハウスで、オラクルのラリー・エリソン氏、ソフトバンクの孫正義氏、OpenAIのサム・アルトマン氏と共に発表した合弁会社として設立する「Stargate」の目的やロードマップの話。また、o1の次バージョンとなるo3のminiバージョンとフルバージョンの製品概要やリリーススケジュール、またAIエージェントやヒューマノイド研究開発の現状やOpenAI社の営利企業化への舵取りの課題などについての情報が提供されています。以下は主だったトピックスです。
Stargateの設立目的とOpenAIのポジション
oシリーズの新モデル・リリース計画
AIエージェントの応用開発の開発とヒューマノイドロボット
AI規制と競争環境、OpenAI営利化への課題
1. インタビュー
[ジョアンナ・スターン](WSJ)
昨夜の大きなニュース、Stargateについてお話しします。もしそのニュースをまだご覧になっていない方がいらっしゃいましたら、これはOpenAI、Oracle、ソフトバンクによる画期的なジョイントベンチャーのことです。このプロジェクトは、まず1000億ドルを投じて米国のAIインフラ構築を進め、最終的には5000億ドル規模に拡大する計画です。
では、初期段階で具体的にどのようなメリットが期待されるのでしょうか?
[ケビン・ワイル](OpenAI)
まず、最も重要なポイントですが、サム・アルトマンCEO、オラクルのラリー・エリソン、ソフトバンクの孫正義氏、そしてトランプ大統領が、ホワイトハウスのルーズベルトルームで新会社「Stargate」を設立する意向を発表しました。このプロジェクトの目的は、米国内のAIインフラに向けて5000億ドルを投資することです。そのうち1000億ドルは今後4年間で投入される予定です。最終的には、コンピュート能力の増強がより優れたモデルの開発につながり、そこからより良い製品が生まれ、世界中の問題を解決するという結論に行き着きます。我々はこれに真剣に取り組んでおり、必要なインフラとコンピュート能力を自ら確保することで、進化するモデルで実現可能な成果を確実に達成していきます。
[ジョアンナ・スターン]
では、このプロジェクトの初期段階はデータセンターから始まると考えてよいのでしょうか?
[ケビン・ワイル]
GPUを備えたデータセンターがその中心となります。これらのデータセンターは、モデルのトレーニングと推論の両方を担い、製品を支える役割を果たします。これまでの経験から、コンピュート能力を増やすことでモデルが向上することは明らかです。この傾向が止まる兆しはなく、今後10年間で世界中の人々に向けた製品を構築するために必要なコンピュートを確保することが、我々の目指すところです。
[ジョアンナ・スターン]
このプロジェクトで米国内でのチップ製造を期待していますか?
[ケビン・ワイル]
現在のところ、NvidiaとMicrosoftが技術パートナーとして協力しています。
[ジョアンナ・スターン]
とはいえ、OpenAIが将来的にチップ製造について議論する可能性があるという話もありますね。
[ケビン・ワイル]
それについては、まだ分かりません。
[ジョアンナ・スターン]
それでは少し楽しい話題、製品に関する話をしていきたいと思います。質問しても答えがわかっている気がしますが。
あなたは製品担当責任者ですので、これまでに発表したり話題になった製品について少しお話しいただき、リリース時期についても教えていただけますか?
[ケビン・ワイル]
わかりました、そういう話をするんですね?
[ジョアンナ・スターン]
そうです、それをここでやりましょう。
[ケビン・ワイル]
私の目的は、ここでたくさんのニュースを発表することです。
[ジョアンナ・スターン]
それが私たちがThe Wall Street Journalでやることです。
[ケビン・ワイル]
一つだけ確かなのは、エンジニアチームがプロダクトマネージャーから日程を示されるのを喜ぶということです。
[ジョアンナ・スターン]
この発表があなたのチームをやる気にさせると思います。これを家に帰ったときのチームへのモチベーションだと考えてください。
[ケビン・ワイル]
わかりました、いいですね。
[ジョアンナ・スターン]
では、楽しいゲームを始めましょう。
[ケビン・ワイル]
本当に助かります。
[ジョアンナ・スターン]
これは少なくとも私には楽しいゲームです。皆さんにもきっと楽しいはずです。ただ、あなたにとっては楽しくないかもしれません。
[ケビン・ワイル]
ええ、私たちはこれに非常に興奮しています。それでは少し話を戻してよろしいでしょうか。
まず、これらのモデルが何なのかを皆さんにしっかり理解してもらいたいと思います。この分野ではいくつかの大きなトレンドが見られます。モデルのコストが劇的に安くなっているんです。たとえば、GPT-3を2年前に発表したときとGPT-4を比べると、コストが100倍違います。GPT-3はGPT-4より100倍高かったのです。この2年間で価格が99%も下がっています。 同時に、モデルは格段に賢くなっており、この後o3についてお話しする際に詳しく説明します。また、速度が向上し、安全性も高まっています。これらのトレンドが収束していることが、我々や孫(正義)さん、他の多くの方々が5000億ドルを投資する価値があると考える理由です。
ほかに、コストが99%も下がりながら、システムが速く、賢く、安全になる例を知っていますか?私はほかに例を知りません。 おそらく皆さんはGPT-4にすでに慣れ親しんでいると思います。ChatGPTではデフォルトで使われていますね。
昨年末に、私たちは研究での大きなブレークスルーを発表しました。それをo1というモデルに導入しました。実はこれは全く別の命名スキームなんです。 その理由は、このモデルがGPT-4にはできないことを可能にしたからです。それは「推論」です。GPT-4は素晴らしいモデルです。多くの知識を持ち、質問をすれば即座に答えを返してくれます。いわば「システム1」のような思考です。しかし、oシリーズのモデル、たとえばo1やその後継モデルは、実際に推論ができます。 たとえば難しい質問をしたり、クロスワードパズルを解くときのことを考えてください。すぐに答えを出すのではなく、「まずいくつか可能性があるな」と考えますよね。そして次のヒントを得て、「3文字目にAが入る」とわかると、「ああ、これだ!」と気づきます。このように仮説を立て、検証し、それを繰り返しながら問題を解決していきます。 こうしたプロセスが、飛行機の予約や科学研究など、難しい問題を解くときに必要なのです。このモデルは、初めてそれを実現できるようになりました。 同時に、推論だけでなく、あらゆる推論のベンチマークでこれらのモデルはGPT-4を大きく上回っています。完全に次元が違う性能です。 私たちはこのモデルを発表しましたが、次に登場するのがo3です。私たちの友人であるTelica社がo2というネットワークを持っているため、番号を1つ飛ばしています。
[ジョアンナ・スターン]
そうだと思いました。考えてみて、「ああ、これは本当に大きな飛躍なんだろうな」と思ったんです。
[ケビン・ワイル]
そう、それが私たちの言うべきことですね。
[ジョアンナ・スターン]
それがあなたの言うべきことです。本題にかなり深く入り込んできましたね。
[ケビン・ワイル]
またあなたに助けてもらっていますね。
[ジョアンナ・スターン]
私は、あなたのヘルプのためにここにいます。
[ケビン・ワイル]
とにかく、o3についてです。実はもうひとつ非常に興味深いことが起きていて、それが楽観的な気持ちを与えてくれます。それは、GPT-3からGPT-4に移行するのに約18か月かかったということです。それは比較的速いと思います。多分覚えていないかもしれませんが、今GPT-4に慣れてしまった後でGPT-3に戻ったら、「うーん」と感じるはずです。当時はGPT-3に驚かされ、チューリングテストを軽々と超えたことに感動していました。「こんな世界に生きているなんて信じられない」と思ったのを覚えています。 でも今、GPT-3に戻ると、「これは使いたくないな」と感じるでしょう。 その移行には18か月かかりましたが、o1からo3までは約3か月です。イテレーションのサイクルがどんどん短くなっていて、私たちはすでにo3の次のモデルのトレーニングを始めています。これにより、また大きな能力向上が見られると期待しています。モデルが非常に賢く、非常に速く進化していることに興奮しています。
[ジョアンナ・スターン]
それで、いつ出るのか教えてくれるんですよね?
[ケビン・ワイル]
もちろんです。リリースの時間までお伝えしますよ。 o1のプレビュー版をリリースしたとき、これらのモデルをベンチマークする方法の一つとして、特にコーディングの分野では、競技プログラミングコンテストに参加させるという方法を使いました。これは非同期で実施でき、人間と同じように評価されるため、良いベンチマーク方法です。 最初のバージョンでは、モデルの能力は世界で100万位のプログラマーに相当しました。これでも悪くはありません。世界の上位2~3%に入るレベルです。しかし、o1のフルバージョンをリリースしたときには、世界で1000番目のエンジニアと同等の能力に達しました。 そして今、o3では、世界で175番目のエンジニアに匹敵するレベルになります。これが3~5か月ごとのバージョン間の進歩なのです。私たちは、100万番目から175番目のプログラマーまで成長を遂げました。この先、さらなる進化を続けてどこまで行くかを想像してみてください。 だからこそ、これらのモデルに非常に期待しています。 通常、これらのモデルは2つのバージョンでリリースします。ミニバージョンとフルバージョンです。ミニバージョンは数学やソフトウェアエンジニアリングといった核心的なスキルを維持しつつ、全ての知識は持っていません。ただ、推論が非常に速く、安価に実行できます。一方で、フルバージョンは全てを統合したものです。 o3のミニバージョンはもうすぐリリース予定で、フルバージョンはその後に続きます。順調にいけば2月か3月を目指しています。これが現在の目標です。
[ジョアンナ・スターン]
わかりました。
[ケビン・ワイル]
長い回答になってしまいましたが、背景を知っていただけたと思います。
[ジョアンナ・スターン]
そして、今お話しされた内容の多くに触れていきますが、これは非常に役立つ情報で、次にお伺いしたい製品である「エージェント」についての導入にもなります。
[ケビン・ワイル]
素晴らしいですね。
[ジョアンナ・スターン]
いつですか?
[ケビン・ワイル]
2025年は、エージェントが現実のものになる年だと思います。現在はChatGPTを使う際、主に質問をして答えをもらう形が一般的ですが、これからはChatGPTが実世界で実際に行動を起こすようになります。
自分の1日の過ごし方を考えると、あるいはブラウザでの時間の使い方を振り返ってみると、その半分くらいは本当に興味のあることに費やしています。例えば、WSJの記事を読んでいます。それももちろん、ジョアンナの記事ですけどね。
[ジョアンナ・スターン]
その記事には半分しか興味がないんですか?
[ケビン・ワイル]
いえ、そうではなく、興味があるのは半分の時間という意味です。それは興味のあることの例として挙げたものです。
[ジョアンナ・スターン]
なるほど。
[ケビン・ワイル]
例えば、何かを読んだり、YouTubeの動画を見たり、自分が関心を持っていることに時間を使っています。でも残りの半分は、子どものサッカーの申込書を記入するようなことに費やしていて、1日のうち30分を取られてしまいます。その30分を取り戻せたらいいのにと思います。なぜAIがそれを代わりにやってくれないのでしょうか?
こういったことが、これからChatGPTができるようになることです。先ほど述べた推論能力だけでなく、私たちは「マルチモーダル」という技術にも取り組んでいます。これは、ChatGPTがテキストを理解するだけでなく、人間と同じようにさまざまな方法でやり取りできるようにするというものです。
例えば、ChatGPTが話しかけることができ、逆に話しかけることもできる。そして、それを50~100の言語で理解することが可能になります。さらに、ChatGPTは物を見ることもできます。スマホのカメラで何かを指し示すと、それが何なのかを理解できるのです。また、ブラウザの画面を見ることもでき、単にHTMLを解析するだけではなく、画面上のビジュアル要素を理解します。検索ボックスがどこにあるか、ボタンをクリックするとどうなるかなども認識できます。
こうした機能により、実際の問題を解決し、日常的な作業に費やす時間を節約するツールを構築できます。その結果、より大切なことに集中できるようになるのです。
[ジョアンナ・スターン]
話を整理すると、こういうツールを想像しました。それが私のパソコン画面に表示されているものを認識して、「子どもの昼食申込書を記入して」と指示すると、もっと具体的にしなければいけないかもしれませんが、エンターキーを押すだけで、その作業を代わりにやってくれる。しかも、そのフォームを送信するところまで完全に処理できるというイメージですか?
[ケビン・ワイル]
ええ、それに加えてリリース時期の情報もお伝えします。この機能の一部はすでにリリースしています。MacやWindows向けのデスクトップアプリを使えば、それを体験できます。ブラウザタブとは異なり、デスクトップアプリはさらに多くのことが可能です。
明確な許可をユーザーからいただければ、ChatGPTは画面全体や使用中のアプリを確認できます。もちろん、特定のウィンドウを見る前に、必ずユーザーの許可を得る仕組みです。
現在の機能では、画面上に表示されている内容を読み取ることができます。例えば、コーディング中にコンパイラーエラーが出てその意味がわからない場合、「このアプリを見て、どうすればいい?」と尋ねるだけで、画面を読み取り、問題を理解し、解決方法をガイドしてくれます。コピー&ペーストを繰り返す必要がありません。
近い将来、さらに進化して、「ここ、私が修正しておきますね」という形で対応できるようになるでしょう。このような機能はすでにデスクトップアプリで実現しており、今後さらに幅広く展開していく予定です。
[ジョアンナ・スターン]
今年中に?
[ケビン・ワイル]
ええ、もちろんです。今年の第1四半期にはこれらの機能が見られるようになり、その後も継続的に展開していきます。大事なのは、ユーザーがコントロールできる形でこれを実現することです。モデルは完璧ではありませんし、第1四半期や第2四半期の段階ではまだミスをすることもあるでしょう。
モデルが実世界で作業を行う場合、単に質問への答えを間違えるよりも重大な影響を及ぼす可能性があります。ですから、我々はモデルが行う作業の中で、どの部分が可逆的でどの部分が不可逆的なのかを慎重に検討しています。
例えば、フォームを記入した後に「記入が完了しました。送信ボタンを押しますか?」と確認するようにしたり、ユーザーがモデルを信頼できるようになるまで、最終的な判断をユーザーに委ねる仕組みを作っています。Amazonでの買い物のような作業では、カートに商品を入れるところまでをAIが行い、購入の最終判断はユーザーに任せるといった具合です。
このようにして、モデルがどこで作業を一旦止めるべきか、その境界を教えています。モデルが進化し、ユーザーの信頼が高まれば、この境界は変化するかもしれませんが、現時点ではユーザーが常にコントロールできることを重視しています。
[ジョアンナ・スターン]
これは信頼の構築に向けた取り組みです。いわば「AI版のトラストフォール」です。
[ケビン・ワイル]
AI版のトラストフォール、いいですね。
[ジョアンナ・スターン]
あと1つか2つ製品についてお聞きして、それから別の話題に移ります。
[ケビン・ワイル]
リリース日を正確に伝えるのはどうですか?
[ジョアンナ・スターン]
皆さんどう思いますか?うまくやっていますよね?
[ケビン・ワイル]
四半期はお伝えしました。
[ジョアンナ・スターン]
四半期を教えてくれました。それはいいですね。
[ケビン・ワイル]
今の四半期に入っていますから、つまり—
[ジョアンナ・スターン]
o3やo3 Miniについては、月単位で情報をいただきましたよね。クリエイター向けに「トレーニングからのオプトアウトツール」を約束していましたが、それについてはどうですか?
[ケビン・ワイル]
現在も開発中です。詳細については準備が整ったらお話しします。
[ジョアンナ・スターン]
第2四半期ですか?
[ケビン・ワイル]
それは様子を見てからですね。
[ジョアンナ・スターン]
様子見ですね。ヒューマノイドロボットについてはどうですか?
[ケビン・ワイル]
今年はありません。
[ジョアンナ・スターン]
今年はないんですね。では、1年先でしょうか?
[ケビン・ワイル]
様子を見てというところです。ただ正直に言って、次の大きなブレークスルーは、私たちか他のどこかかにかかわらず、そのことになるだろうと思います。AIが私たちの時間の使い方に大きな影響を与える最も自然な場所は、デジタルの領域です。これらの技術はデジタルネイティブであり、その領域で最も即効性のある変化をもたらします。
しかし、マルチモーダルといった能力が発展し始めると、つまり話したり、見たり、現実世界を理解したりする能力が備わると、次のフロンティアはロボティクスになります。私たちか他のどこかが実現するかはわかりませんが、ロボティクスは現在のAI革命の数年後に続くことになるでしょう。今年はAIが私たちの生活を改善する点で大きな年になるでしょうし、ロボティクスはその2~3年後に続くと思います。
[ジョアンナ・スターン]
あなたたちもロボティクスに取り組んでいますよね?最近、研究ラボの一部を再開したのではありませんか?
[ケビン・ワイル]
ええ、少しずつ考え始めています。少人数のチームで取り組んでおり、この分野が大きな影響を与えられる領域なのかを探っています。
私たちにはChatGPTのようなファーストパーティ製品がありますが、同時に開発者向けツールも提供しています。ChatGPTは週に3億人以上が利用しており、APIを使って素晴らしいものを構築している開発者も300万人以上います。そのため、私たち自身がいくら頑張っても、AIが世界的に与える影響のほんの一部に過ぎないことを理解しています。だからこそ、強力な開発者プログラムに注力しています。ロボティクスやその他の分野で活動する企業が、私たちのモデルを活用して素晴らしい革新を生み出せるようにするためです。
[ジョアンナ・スターン]
パートナーシップについてお伺いします。OpenAIは、これまでAppleやMicrosoftを含む多くの企業と協力してきた、いわばAIパートナーシップの「スイス」のような存在でした。ただ、その中立性はいつまでも続けられるものではないようにも感じます。特にAppleやMicrosoftがStargateのようなプロジェクトに関与している中で、パートナーシップについてどのようにお考えですか?
[ケビン・ワイル]
プロダクトの観点から言えば、ChatGPTを常にユーザーのそばに置き、ワンタップでアクセスできるようにしたいと考えています。今のところ、ほとんどのアプリでは、スマートフォンのロックを解除してアプリを見つけて開く必要があります。それでも十分ですが、この敷居を下げられたらどうでしょう。例えば、iPhoneのサイドボタンを長押しするだけでChatGPTにアクセスできるようになれば、利用頻度が増え、より効果的に役立てることができます。
これが、Appleとのコラボレーションの大きな一部であり、非常に期待している点です。Appleのインテリジェンスプラットフォームはまだ初期段階で、世界中に完全に展開されているわけではありませんが、iPhoneで長押しするだけでChatGPTに瞬時にアクセスできるというアイデアは素晴らしいものです。
また、ホリデーシーズンに1-800-CHATGPTを立ち上げたのも同じ理由からです。ChatGPTを使っている方は多いと思いますが、1-800-CHATGPTをご存じの方はどれくらいいらっしゃるでしょうか?おそらく少ないですよね。
アイデアはシンプルです。私たちは1-800-JGPT(または1-800-242-8478)という番号を所有しており、それを連絡先に保存してWhatsApp経由でテキストを送ることで、ChatGPTとやり取りできます。プラットフォームの制約からアプリほどリッチな体験は提供できませんが、世界中の30億人のWhatsAppユーザーにChatGPTを届ける素晴らしい方法だと思います。
これは、AGIを開発するだけでなく、それを人々の生活に役立つ形で提供するという私たちの広範なミッションの一環です。APIエコシステムを誇りに思っています。これにより、300万人の開発者が素晴らしいものを構築していますが、それだけでなく、Appleとの統合やWhatsAppを通じて、あるいは人々が日常的に時間を費やしている場所で、ChatGPTを直接利用できるようにすることにも力を入れています。
[ジョアンナ・スターン]
次に、お金の話をしたいと思います。サム・アルトマン氏が数週間前にツイートで、OpenAIが月額200ドルのProプランで赤字を出していると述べていましたね。
[ケビン・ワイル]
その点については、私たちは非常に満足しています。
[ジョアンナ・スターン]
赤字を出すことが好きなんですか?
[ケビン・ワイル]
いえ、そういう意味ではなく、こういうことです。
昨年末にProプランを立ち上げましたが、その背景にはいくつかの理由があります。私たちはChatGPTを無料で提供しています。ログインすら必要なく、ウェブサイトにアクセスしてすぐに使い始めることができます。ログインすればレートリミットが少し高くなりますが、それでも無料です。
さらに月額20ドルのPlusプランも提供しています。このプランでは、より多くの機能や高性能なモデルにアクセスできます。しかし、それでも月額20ドル分以上にAIやコンピュートを利用したいというユーザーがいることに気づきました。それだけChatGPTが彼らにとって価値のあるものだったのです。
そこで、事実上無制限のChatGPTを提供する方法を作りたかったのです。もちろん、「無制限」には注意書きが付きます。悪用を防ぐ必要があるからです。それを月額200ドルという消費者向けプランとしては高めの価格に設定しましたが、それでもこれを必要とするユーザーがいるとわかっていました。彼らにとって、ChatGPTを最大限に活用することが重要だったのです。
興奮するのは、実際にこれを活用し、月に200ドル以上のコンピュートリソースを使用している人々がいるという点です。もちろん、この形でビジネスを永遠に運営するのは現実的ではないこともわかっていますが、コストが急速に低下しているのも事実です。
私たちの基本的なアプローチは、より多くのAIをより低価格で提供することです。この6~12か月間で、コストを削減し、レートリミットを引き上げ、無料プランやPlusプランに多くの機能を追加してきました。Proプランにも時間をかけて価値を追加していきます。
コストが急速に下がる一方で、モデルが賢くなるというのは非常に興味深い状況です。私たちは、AIをできるだけ多くの人々に届けることが、世界にとって圧倒的にポジティブな影響をもたらすと考えています。Proプランが多くの人々にこれほど価値を提供しているのを見ると、本当に素晴らしいと感じます。
[ジョアンナ・スターン]
AIや製品について多くお話しいただきましたが、ここでOpenAIの人々についてもお聞きしたいと思います。この1年、あるいは2年間は会社にとって波乱の時期だったのではないでしょうか。あなたは6月にOpenAIに加わりましたが、それ以前にはMetaやTwitterで、多くの人々を対象とする製品を開発し、収益化を模索する中で非常に厳しいプレッシャーを経験されてきました。
昨日、Axiosで「この業界では人が出入りするのは普通のことだが、今は特に混乱しているように感じる」とおっしゃっていたのを聞きました。この状況をどのように捉え、チームがOpenAIに留まり、一緒に製品を作り続けられるよう、どのように指導しているのですか?
[ケビン・ワイル]
面白いことに、ハイパーグロース段階にある会社では、外部から見た印象と内部で感じる現実が大きく異なることがあります。これはTwitterの初期やInstagramで感じたことですが、例えば報道で取り上げられる内容(もちろん、悪意はないと思いますが)が社内ではそれほど大きな問題になっていない場合があります。逆に、内部で非常に重要に感じられていることが外部では全く注目されないこともあります。
[ジョアンナ・スターン]
それはリークすべきですね。
[ケビン・ワイル]
ああ、ありがとうございます。
[ジョアンナ・スターン]
そういうリークは、ぜひ私たちのところにどうぞ。
[ケビン・ワイル]
なるほど、これまでずっと間違っていたんですね。わかりました。
[ジョアンナ・スターン]
続けてください。
[ケビン・ワイル]
知っておいて良かった。いずれにせよ、私はこれまでいくつかのハイパーグロース企業で働く幸運に恵まれましたが、どの会社でも初期から在籍していた人が、「自分は20人の頃に入社して、今は200人や2000人になっている。少し変わってきたし、新しい挑戦をしたい」と考えるケースがありました。それは全く問題ありません。
私たちの仕事は、そうした人々の貢献を称え、感謝しつつ、ミッションに向けて世界で最も優れた人材を引き続き採用することです。それが毎日のフォーカスです。
[ジョアンナ・スターン]
ただ、OpenAIが非営利の研究機関から営利企業へと移行したことについて、社内外から多くの反発がありましたよね。あなたのチームは、収益を上げるための新しい製品を開発する中心にいます。まだ月額200ドルのプランでは利益が出ていないかもしれませんが、すぐにそうなるようですね。この件に関する緊張感にはどのように対応していますか?
[ケビン・ワイル]
正直に言うと、この件について社内ではほとんど緊張感はありません。この問題は外部で議論されることが多いだけで、内部では特に悩まれているわけではありません。
話は単純で、サムもこれを何度も語っていますが、OpenAIはもともと少人数のグループでAGI(汎用人工知能)を構築するというアイデアのもと、非営利としてスタートしました。当時は、AGIが可能だと信じている人はほとんどおらず、「狂った人たちが無謀な挑戦をしている」と見られていました。
しかし、GPT-1やGPT-2のブレークスルーを達成するにつれ、AGIを実現するには膨大なコンピュート能力、つまり資金が必要だとわかってきました。これは純粋な非営利モデルとは相容れないものです。
当時、まだ今のOpenAIのような存在ではなく、小さなグループだったため、会社を存続させる最も簡単な方法は、資金を調達できる営利部門を会社の一部として設立することでした。それがミッションを継続させる方法だったのです。
もちろん、今では会社は大きく成長しました。一部の人にとっては、非営利団体が成長する営利企業を所有しているのは奇妙に感じられるかもしれません。現在のアイデアは、この状況を正直に認識し、非営利団体を存続させるための再構築を進めることです。この非営利団体は私たちのミッションの中核であり続けます。
非営利団体は、ヘルスケアや教育といった分野で大きな貢献ができると信じています。そのため、この団体が全体の会社の重要な部分を所有し続け、世界にポジティブな影響を与えられる主要な存在であり続けることを目指しています。
[ジョアンナ・スターン]
最大の懸念は安全性についてだと思います。多くの人がその解決策として規制に期待していますよね。この週末、いくつかの就任式イベントのためにワシントンD.C.に行かれていたそうですね。昨夜、トランプ大統領がインフラ計画を発表されたときにも同席されていましたよね。OpenAIは規制に対して積極的な姿勢を示してきましたが、今後4年間でどのような規制が望ましいとお考えですか?
[ケビン・ワイル]
AIは、すでに他の規制された産業と交わる場面では規制を受けています。例えば、ヘルスケアでは医療関連の規制を守らなければなりませんし、法分野では法律を遵守する必要があります。それがあるべき姿です。AIは真空状態で動いているわけではなく、他の製品やサービスと同じように、それぞれの分野の規制枠組みに従います。
そうは言っても、今は競争の真っただ中にいます。米国、ひいては西側諸国がこのAI競争で勝つ必要があります。私は中国が勝つことを望んでいません。もし民主的価値観を共有しない国がAIで先行したら、世界は全く違う方向に進むでしょう。
イノベーションを促進する必要がある一方で、規制に反対するわけではありません。ただし、避けなければならないのは、50の州がそれぞれ異なる規制枠組みを持つ「パッチワーク状態」です。そうした分断は、私たちだけでなく、この分野の全ての企業の足かせになります。その時点で競争に負けてしまうことになり、それははるかに悪い結果を招きます。
[ジョアンナ・スターン]
ヘルスケアや法分野のように、既存の規制がある産業について触れられましたが、AIを規制するために「F-AI」(Federal AI?)のような専門機関を設立すべきだと思いますか?
[ケビン・ワイル]
正直に言うとわかりません。私たちは一貫して、規制に対してオープンだと伝えてきましたが、それは新しい産業をまだ初期段階のうちに窒息させるような規制ではない場合に限ります。
[ジョアンナ・スターン]
昨日、Anthropicのダリオ(・アモデイ)さんにインタビューした際、2027年までにAIがほとんどの分野で人間を超えると考えていると言っていました。それはOpenAIの見解でもありますか?その研究室でその兆しを感じていますか?また、それに何を期待し、何を恐れるべきでしょうか?私たちはダボスの地下シェルターに向かうべきでしょうか?
[ケビン・ワイル]
正確な日付を予測するのは難しいです。何しろ研究ですからね。これはOpenAIやAnthropicのような場所で働く際のユニークな点の一つです。他の企業とは異なり、何百人もの人々が研究を行い、人類がこれまで知らなかったことを明らかにしようとしています。これは学問的な性質を多く含んでおり、タイムラインは本質的に不確実です。
とはいえ、非常に急速な進化の軌道上にあるのも事実です。先ほど、3~4か月の間に100万番目のプログラマーから175番目のプログラマー相当の能力に進化したと話しましたが、このペースを考えると2027年より早く実現する可能性もあります。
この時代にどのように向き合うべきかについてですが、私は実際にAIを使ってみるのが最善の方法だと思います。外側から記事を読んでいるだけだと、不安や恐怖を感じやすいですが、使ってみると、AIが役立つ点、まだ不完全な点、改善されている点がわかります。この変化に参加することで、不安感が軽減されると思います。
最終的に、AIを使い、それに関与する人々が、社会がAIを規制し、標準を設定する際に重要な役割を果たすでしょう。より多くの人が積極的に使用することで、AIができること、そしてすべきことについての集団的な理解が深まり、変化の中でより良い意思決定が行えるようになると考えています。
今後数年間で大きな変化が見られるだろうと思っています。
[ジョアンナ・スターン]
AGIが実現し、多くの仕事で人間が必要なくなった場合、空いた時間で何をしますか?
[ケビン・ワイル]
えっと・・・
[ジョアンナ・スターン]
聞いた話では、ランニングをされるとか。
[ケビン・ワイル]
そうです。私は走ったり、バイクに乗ったりしています。それから、3人の子どもがいて、みんな元気いっぱいで手がかかりますね(笑)。でも、よくわかりません。ただ、人間には自分を超えた何かを求める本能的な衝動があると思います。人には人生におけるミッションが必要で、それはAIの時代になっても変わらないと思います。
私は、みんながベーシックインカムをもらって、ただ座って本を読んだり、何もしなかったりするようになるとは思っていません。人は常に何か大きな目標を求めるものだと思います。
歴史的に見ても、特に技術革新による大きな社会変化があったとき、人類の滅亡を予測する声は常にありました。自動車、ラジオ、テレビ、電気、印刷機——どれを取っても人々は適応してきました。そして、これらの発明がなかった時代に戻りたいと思う人は誰もいないでしょう。
AIも同じだと思います。すでに世界を変え始めていますし、これからも変化をもたらしていくでしょう。ただし、それは良い方向への変化です。変化の先に立ったとき、「子どものサッカーの申込書を記入するのに1時間もかけていた頃に戻りたい」なんて誰も言わないはずです。これから起こることが本当に楽しみです。
[ジョアンナ・スターン]
では最後の質問をします。人間と、これまであなたが一緒に働いてきた人々についてです。あなたはTwitterのジャック・ドーシー氏、Metaのマーク・ザッカーバーグ氏、そして現在はサム・アルトマン氏といった非常に個性的なリーダーのもとで働いてきましたね。本当は彼らをランク付けしたいところですが、それは公平ではないと思うので(笑)、誰が一番上手に会議を運営しますか?
[ケビン・ワイル]
誰が一番上手に会議を運営するかですか?それは難しいですね...
[ジョアンナ・スターン]
なんだか人間らしい質問ですよね。人間は会議が好きですから。
[ケビン・ワイル]
そうですね。マークはサムやジャックよりも構造的なアプローチを取る人です。マークは常に仮説を持って会議に臨みます。そのテーマについて深く考え抜いています。非常に野心的でありながら、今からその目標に至るまでの道筋を常に頭の中で描いています。
マークと働いていて素晴らしいと感じたのは、彼がフィードバックを受け入れる人だという点です。「私はあなたが間違っていると思います。その理由はこうです」と伝えることができます。ただし、その後の議論に備える必要があります。彼には彼なりの考えがあり、それを強く持っています。彼を説得して間違いを認めさせることは可能ですが、そのためにはしっかりとした意見を持ち、それを守る準備が必要です。
一方、サムはどちらかというとビジョナリーなタイプです。彼は指数関数的な変化を理解する能力において、これまで出会った中で最も優れた人です。一般的に、人間は指数関数的なトレンドを予測するのが苦手です。私たちは自然と線形的に考えてしまいがちで、指数的な曲線上にいるときでもそうです。
しかしサムはそれを見抜きます。彼は未来を見据え、「これが本当に指数的であれば、3年後にはあなたが思っている場所にはいない。それよりもずっと先に進んでいる」と言います。だからこそ、私たちは5000億ドルをAIインフラに投資する企業を構築しているのです。サムは他の誰よりもこのような変化を読み取り、それに備えるために必要なことを実行しています。
2. オリジナル・コンテンツ
オリジナル・コンテンツは、以下リンクからご視聴になれます。
尚、本投稿の内容は、参考訳です。また、意訳や省略、情報を補足したコンテンツを含んでいます。
WSJ Newsより
(Original Published date : 2025/01/22 EST)
<御礼>
最後までお読み頂きまして誠に有難うございます。
役に立ちましたら、スキ、フォロー頂けると大変喜び、モチベーションにもつながりますので、是非よろしくお願いいたします。
だうじょん
<免責事項>
本執筆内容は、執筆者個人の備忘録を情報提供のみを目的として公開するものであり、いかなる金融商品や個別株への投資勧誘や投資手法を推奨するものではありません。また、本執筆によって提供される情報は、個々の読者の方々にとって適切であるとは限らず、またその真実性、完全性、正確性、いかなる特定の目的への適時性について保証されるものではありません。 投資を行う際は、株式への投資は大きなリスクを伴うものであることをご認識の上、読者の皆様ご自身の判断と責任で投資なされるようお願い申し上げます。