
OpenAIは実際にひどい
3,528 文字
OpenAIとDeepSeek R1との戦いは笑えます。彼らが実際に訴訟の根拠があると信じていることが、とても面白いと思います。彼らが「すみません、私たちの利用規約には商業目的での蒸留は許可されていないと明記されています。それは違法であり、絶対に違法であるべきです。ひどい、ひど」と言っているのです。
そして、あなたはそこに座って気づくのです。ちょっと待ってください。あなたたちはGPLライセンスのコードをたくさん学習に使いませんでしたか?GitHubを探り回って、おそらく何百ものライセンスを破っていませんでしたか?オープンソース化も見られませんし、そういったことは何もしていませんよね。
ちょっと待ってください。ライセンスの利用可能性が本当に明確ではない画像をたくさん使用しませんでしたか?変ですね。Twitterからも取得しましたよね。Twitterは投稿がTwitter上で利用可能だと言っていますが、第三者サービスがすべてのデータを取得して学習し、自社のものを作って金儲けに使えるとは言っていなかったと思います。
だから、一貫してライセンスを破ってきたあなたが、自分のライセンスが破られたと感じて不正だと主張するのは奇妙ですよね。この状況の滑稽さを表現する英単語さえないかもしれません。これは私が今まで見た中で、OpenAIの最も完璧な描写かもしれません。彼らのやっていることは実際にかなりひどいものです。
ちょっと待ってください。これは見ていませんでした。著作権の部分がよく分からないので、読んでみましょう。米国著作権局が人工知能に関連する著作権の法的および政策的問題についてのレポートのパート2を公開しています。正直に言って、米国著作権局の中に何が起きているのか本当に理解している人は一人もいないと思います。技術的な深い知識も全くありません。
彼らは、クローニズム(縁故主義)や汚職、AIの運営を許可するために政府の力を振るうために裏で金銭を受け取っているか、単に何が起きているのか全く分かっていないかのどちらかだと確信しています。だから政府が「私たちが対処します」と言うのを聞くと、「ああ、そうですか」とい思うだけです。
このレポートの一部は、生成AIを使用して作成された出力の著作権性について扱っています。著作権局は、既存の著作権法の原則が、過去の技術革新に適用されてきたように、この新しい技術にも柔軟に適用できると確認しています。生成AIの出力は、人間の作者が十分な表現要素を決定した場合にのみ著作権で保護できると結論付けています。
ちょっと整理させてください。生成AIは著作権法を破ることができ、その後、他の人々がそれを使って著作権を主張できる素材を生成できるということですか?私は弁護士ではありません。でも、これが全く理解できません。
私は論理的な思考、AからBへ、BからCへ、CからDへというような直線的な論理はかなり得意だと思います。それが私の真骨頂だと感じています。でも、これを見ても、全く理解できません。どうやってAからBに至ったのか、まったく分かりません。「ああ、そうそう、盗んだものね。盗んだ後で『これは私のものです』と言えるってことね」。これは、ボールを手渡された人が「これは私が作ったものだ」と言うミームのようなものです。
まあ、誰も何も所有していないということで、私たちは全員訴えられ、かつ誰も訴えられないということですね。これは面白いですね。インターネット上でよく起こることです。ある企業や個人が何かの専門家とされ、特定の行動をとります。その行動を見て「ああ、彼らはこういうことをするんだ」と思います。しかし、彼らが自分たちがやっているのと全く同じことを他人がやっているのを偽善的に指摘すると、評判が破壊されます。人々はそれを激しく嫌います。
だからOpenAIは、もう話すのを完全に止めなければなりません。「ああ、はい、彼らが私たちを蒸留したのは全く問題ありません」と100%言わなければならないのです。
ところで、これに関して最後にもう一つ。皆さんに非常に非常に重要なことを知っておいてほしいのです。人々がDeepSeekの成果を見て、どれほど素晴らしいか、すべてが終わったことが信じられない、実際にすべてがもっと安くなり、AIが仕事を奪うことになるなどと言っているのを見ています。
R1に関して、非常に重要なことに気付いてほしいのです。OpenAIが数十億ドルをかけて作成したモデルが存在します。R1は明らかにそこに素敵な蛇口を設置し、すべての良い学習をポタポタと滴下させ、より効率的な推論モデルを作成しました。OpenAIをきれいに吸い尽くし、今では相当良い性能を発揮できています。
彼らは恐らく嘘をついています。現実的に考えましょう。恐らく嘘をついていて、実際には数百万ドル、もしかしたら10億ドルを費やしたかもしれません。550万ドルというのは嘘だと仮定しましょう。OpenAIがやったことよりは大幅に安いのでしょうが、一つ重要なことを考えてほしいのです。
人々が言及していないと感じることですが、R1がこれほど優れていて、このように安価なモデルを作れたのは、莫大な費用のかかったモデルの後を追いかけたからです。550万ドルのモデルなんて存在しません。なぜなら、550万ドルのモデルは、非常に高価なモデルなしには存在できなかったからです。
人々はこの論理的な飛躍を見落としています。つまり、無料のランチは存在しないのです。誰かが冷蔵庫の中のランチを見つけて、できるだけ早く食べてしまい、「今日のランチは無料じゃない?みんなヨーグルトをもらえるんでしょ?私の名前はカレンよ、何を言ってるの?」というようなものです。
確かに、彼らは素晴らしいことをいくつかやりました。R1がCUDAを使用せず、独自のバージョンを作ったことは素晴らしいと思います。「CUDAは最悪だ、私たちは全く同じものをより良く書けるはずだ」と考え、実際にそれを実現しました。彼らは本当のチャンピオンです。
R1、あなたたちは実際にパフォーマンス作業を行い、重要なことを完璧にパフォーマンス最適化しました。素晴らしい仕事です。チャンピオンになる方法を示してくれました。でも、だからといって550万ドルで済んだというわけではありません。
この2つを関連付けることはできません。これは、現代のテクノロジーを見て「コンピュータを持つのに1,500ドルしかかからないって何を言ってるの?」と言うようなものです。コンピュータは1,500ドルではありません。あなたが持っているコンピュータには、ほぼ100年の研究が詰まっています。
実際、マーク1は解析機関にインスピレーションを受けているので、150年以上と言えるでしょう。つまり、文字通り150年と数兆ドルの研究が一点に注ぎ込まれているのです。今日のコンピュータは1,500ドルだとは言えません。それは他のすべてのものの結果なのです。
OpenAIはその立場にいて、これだけのお金を使うことができ、R1はそれを追いかけることができました。R1も間違いなく、効率を非常に高める素晴らしいことをたくさんやりました。はい、はい、分かっています。私たちは皆そのチームにいます。彼らは良いことをしました。
でも、これでAIが終わりで、もう誰もお金を使う必要がないと考えるのは馬鹿げています。はい、550万ドルでできました。はい、これで終わりです。これからはモデルの学習は簡単です。数十億ドルのモデルにアクセスするだけで、それさえあれば簡単です。馬鹿げています、完全に馬鹿げています。
これは史上最高の見解かもしれません。誰かがあなたの努力の成果を使って、補償なしにあなたの専門知識を模倣するモデルを学習したのですか?ここにどこかWが抜けているように感じます。
ところで、彼らが使っている証拠についてかなり深く掘り下げています。R1に自分が誰かを尋ねると、「私はChat GPTです」と答えますが、Chat GPT自身も自分が誰なのかを間違えます。彼らのどれに尋ねても、バージョンを間違えたりします。
これは今、一種の自己成就的な予言が起きているからです。そのジョークのバージョンが多く出回るほど、それが期待される答えになる可能性が高くなります。これは次のトークン予測であることを覚えていてください。LLMが行うのは、入力から最も可能性の高い出力を予測しようとすることです。驚くべきことでしょうか?いいえ、驚きません。それはまさにLLMがすることなのです。