GPT-6 ニュース、Suno と Udio が訴えられ、Sora が悪化、Claude がGPTsを開始、そしてその他のAIの進展...

2024年6月29日 04:35

では、AIニュースへようこそ。今回は、AIコミュニティを二分する非常に興味深いニュースがあります。これは、将来の事例にどのように先例を設定するかという点で注目に値するものです。
アメリカのレコード会社が音楽生成AIを訴えたというニュースです。彼らは、著作権を侵害したと主張しています。ここに「米国レコード会社がAI音楽ジェネレーターのSunoとUdioを著作権侵害で訴える」とあります。アメリカレコード協会とレコード会社は、主要なAI音楽ジェネレーターが彼らのアーティストの作品を許可なく学習に使用したと主張しています。
SunoAIとUdioAIについてご存じない方のために説明すると、これらは非常に包括的なプラットフォームで、基本的にどんな種類の音楽トラックでも作成できます。正直に言うと、これらは「まあまあ」とか「それなりに良い」というレベルではありません。本当に、本当に、本当に素晴らしいものなんです。「本当に」を3回も言いましたが、これがどれほど素晴らしいかを強調しきれません。
私が様々なプロジェクトのためにSunoとUdioでコンテンツを作成していたとき、その一貫性、品質、そしてサウンドトラックがどれほど一貫して聞こえるかに驚きました。正直、目を見張るものがありました。だからこそ、これらのレコード会社が訴訟を起こす理由が完全に理解できます。
将来を見据え、物事がどこに向かうかを予測しようとすると、AI音楽ジェネレーターは間違いなくその業界に驚くべき影響を与えるでしょう。つまり、音楽業界が明らかに恩恵を受けている従来のツールの代わりに、これらを使用する人がどれほど多くなるか想像もつきません。
訴状によると、音楽業界は正式にSunoとUdioに対して宣戦布告したとのことです。この2つは最も有名なAI音楽ジェネレーターです。ユニバーサルミュージックグループ、ワーナーミュージックグループ、ソニーミュージックグループを含む音楽レーベルのグループが月曜日に米国連邦裁判所に訴訟を提起し、大規模な著作権侵害を主張しています。原告は侵害された作品1つにつき最大15万ドルの損害賠償を求めています。Sunoに対する訴訟はマサチューセッツ州で、UdioのUncharted社に対する訴訟はニューヨーク州で提起されました。
興味深いのは、SunoとUdioはすぐにコメントを発表しなかったのですが、今日になって非常に興味深いツイートを投稿したことです。彼らは「今日は、AIと音楽の未来について考えを共有したいと思います。過去2年間で、AIはテキストから画像、映画、そして今では音楽まで、多くのメディアで創造的な表現のための強力なツールとなりました。Udoでの私たちの使命は、あらゆる種類のアーティストが驚くべき音楽を作れるようにすることです。
若い企業として、私たちは世界最高の音楽家のスタジオに座り、新進気鋭のソングライターと歌詞を練り上げ、そして何百万人ものユーザーが面白いものから深遠なものまで、驚くべき新しい音楽を作り出すのを見てきました。手を使う能力を失った才能ある音楽家が、再び音楽を作れるようになったという話を聞きました。プロデューサーはAIが生成したトラックをサンプリングしてヒット曲を作り、そして日々の音楽愛好家たちは、愛から悲しみ、喜びまで、人間の感情の核心を表現するためにこの技術を使用しています。
画期的な技術は変化と不確実性を伴います。私たちの技術がどのように機能するか、いくつかの洞察を提供させてください。」ここで彼らは基本的に、私たちは何も著作権を侵害していない、合法的に学習したのだから聞いてくれと述べています。
彼らは続けて「生成AIモデル（私たちの音楽モデルを含む）は、例から学習します。学生が音楽を聴いて楽譜を学ぶように、私たちのモデルは大量の録音された音楽を聴いて学習しました。モデル学習の目的は、音楽的アイデア、つまり誰にも所有されていない音楽表現の基本的な構成要素を理解することです。私たちのシステムは、新しい音楽的アイデアを反映した音楽を作成するように明示的に設計されており、学習セットのコンテンツを再現することには全く興味がありません。実際、著作権で保護された作品やアーティストの声を再現しないよう、最先端のフィルターを実装し、継続的に改良しています。
私たちは自社の技術を支持し、生成AIは現代社会の主流になると信じています。」と述べています。残りは技術的な専門用語なので読み上げませんが、おそらくChatGPTで書かれたものでしょう。
ここで重要なのは、私たちが直面している状況です。一方では、音楽業界からすれば完全に理解できることです。その業界の人であれば、私は約束できますが、曲を書き、プロデュースし、歌やラップなどのボーカルを加えるのには、信じられないほど長い時間がかかります。正直なところ、音楽を趣味や情熱として追求する人々を心から尊敬しています。なぜなら、それらのことには驚くほど長い時間がかかり、称賛に値するからです。
音楽をしている人や音楽業界にいる人が、長年コンテンツを作り続けてきたアーティストの音楽を、UdioやSunoのような企業が本質的にすべてサンプリングし、ダウンロードし、AIシステムを学習させ、それに基づいてプラットフォームを作ろうとしているのを見て、完全に理解できます。これは非常に敵対的な環境を作り出します。なぜなら、ここでの問題は、学習に使われた人々の音楽に対して、実際には何も支払われていないからです。
音楽は、あなたの音楽トラックが使用された場合、通常はロイヤリティを得られるものです。これらの巨大企業、つまりこれらの大規模な複合企業のオーナーは、基本的にこれらのミュージシャンにロイヤリティが支払われることを確実にしています。
人々は「AIだから、すべてが新しく生成的になる」という側に立つかもしれませんが、この状況では、ミュージシャンたちは確かに説得力のある議論をしていると思います。実際に誰かの作品を取り、それでシステムを学習させ、そのシステム全体がゆっくりとその業界を殺していくために使われているのであれば、個人的にはこれは技術の創造的な使用だとは思いません。
はい、これは完全に楽しいものであり、はい、これは本当にクールな使い方です。しかし個人的には、ここではミュージシャンの側に傾いています。なぜなら、ミュージシャンが本当に生計を立てるのに苦労している最前線の領域にいて、彼らが心と魂を音楽トラックに注ぎ込んでいるのを直接見てきたからです。
私が思うに、ここで最良の解決策は、これらの新しい生成AIプラットフォーム、それがどのようなプラットフォームであれ、彼らが最も学習したアーティストや人物に何らかのロイヤリティを支払うべきだということです。これらのプラットフォームは、クリエイターが実際に最初のコンテンツのバッチを作成しなければ存在しなかったと言うのは不誠実だと思います。
例えば、画像の場合、特定の人のスタイルを模倣するようAIプラットフォームに要求でき、それを非常に効果的に行うことができます。そして、AIシステムがあなたのユニークなアートスタイルを複製し、あなたが全くクレジットされていないのに、多くの人々が月額20ドルを払っていて、これらの企業が何百万ドルも稼いでいたら、あなたはどう感じるでしょうか？
私はテクノロジーを嫌っているわけではありません。ただ、私たちが本当に一つとして前進するためには、これらの音楽会社は確実にその利益の一部をこれらのミュージシャンに支払う必要があると述べているだけです。なぜなら、正直なところ、それは彼らの作品であり、彼らはそれに対して支払われるべきだからです。
はい、ある人々はこれが減速だと言うかもしれませんが、もしあなたが彼らの立場だったら、確実に彼らに共感すると思います。そして、ミュージシャンに公平な分け前を支払うのはそれほど難しいことではないと思います。
この話題について長々と話すつもりはありませんでしたが、将来は興味深いものになると思います。これらの音楽会社がこれらの訴訟に負けて、生成AIの会社が今やっていることをそのまま続けることを許されるという状況になるか、あるいは非常に興味深い環境が生まれます。なぜなら、今やインターネット上のすべての作品を学習し、生成AIツールを作れば、それを完全に進めることができるという先例ができてしまい、これは非常に危険な先例となるからです。
または、これらのプラットフォームが支払いを強制され、しかし生成AIは非常にコストがかかるため支払いができずに破産してしまうという状況になるかもしれません。いずれにせよ、この傾向がどこに向かうのか見守るのは非常に興味深いことです。私は間違いなくこれに注目し続けるつもりです。
AIで生成されたアートワークに加えて、Toys R UsがOpenAIのSoraで生成した初のブランドCMをリリースしました。これは、本質的に商業的な生成AIの作品として初めてのものとなります。ここで見られるのは、Soraが何かの制作に使用されているということです。これは基本的に、子供向けのおもちちゃ会社であるToys R Usの広告です。彼らがSoraプラットフォームを使用して生成動画を作成したのが分かります。
これについて最も驚くべきことの一つは、私はこのトレーラーがある意味面白いと思いましたが、これが実際にかなりの反発を受けたということです。コメント、リツイート、引用ツイート、そしてこれを取り巻くすべてのコメントをチェックすると、それらは非常に、非常にネガティブなものです。
これを見てください。これは私の指摘を証明しています。そして、これは私が以前プライベートグループで話したことですが、AI生成コンテンツは人間の創造性のサークルでは非常に嫌悪され、避けられるものだということです。クリエイティブな分野で見られる多くのプロセスは、実際に人間にネガティブな反応を引き起こします。
私はこれについて、AI生成コンテンツの微妙なニュアンスをナビゲートすることと、AIで生成されたものをビジネスの発展に使用することについて、私のポストAIコミュニティで話しました。ここでは、AI生成のものを使用すべきでない例が見られます。
ここで見られるように、「AI生成の画像やマーケティングについて気づいたことは、予算がないというメッセージを発信していることです。これはデジタル版の明らかに偽物のシャネルバッグを身につけるようなものです。あなたのブランド全体が直ちに弱々しく、貧相に見えてしまいます」と述べられています。
ここで私が指摘しようとしているのは、公衆の反応を見ると、これは単に悪い広告を作るよりも悪いということです。私は約束できますが、この傾向は、人間がAI生成のものとより前向きな関係を築くまで、予見可能な将来にわたって続くでしょう。そして、人間がある程度置き換えられることなくAIと共存できる未来を見出すまで、それは起こらないと保証できます。
ここで見られるように、この人は「もう誰もトイザらスで買い物をしないだろう。この広告はただ陳腐でひどい」と述べています。そして、これがたった1つのリツイートと2つのいいねしかないと思ったなら、さらに見てみましょう。この人が「この企業に落書きしよう」などと言っているのが分かりますが、もっと人気のある他のものを見てみましょう。
この人は「トイザらスがAIのCMを公開したけど、クソだな」と言っています。別の人は「おめでとう、OpenAI。トイザらスを台無しにしたな。まず破産して閉店して、そして今度はお前らが」と言っています。また別の人は「私たちは道徳的に破産し、芸術的に破産し、文字通り破産している」と言っています。
ここで見られるように、「子供の無限の想像力についての広告を作り、それを魂のないAIでレンダリングすることには、非常に皮肉なものがある」と言う人のツイートに、驚くほど多くの人がいいねとリツイートをしています。OpenAIのSoraに関して、非常に大量の否定的な感情があり、それが多くの異なるソーシャルチャンネルで繰り返し表現されているのがはっきりと分かります。
ある人は「この狂気に加担したトイザらスに恥を。そしてこんな空虚な広告を作ったことにも」と言っています。ここで重要なのは、下のコメントを見ても、人々がこれを単に非常に嫌っているということです。
要するに、現在は人間がすぐに検出できるようなマーケティングメディアチャンネルでAIを使用するのは、あまり効果的ではないということです。人間がAI生成のものを使用していることを検出した瞬間、それはすぐに拒絶され、より価値の低いコンテンツとして扱われてしまいます。
先ほど言ったように、これは私たち人間にとってはある意味良いことです。なぜなら、もう少し長く人間がループの中に入っていられることを意味するからです。しかし、以前にも言ったように、人間は人間が好きなのです。
このトレーラーが、実際に一人の子供を使い、人間のアーティストの助けを借りてCGIを使用して作られていたら、おそらくバイラルになっていただろうと私は主張できます。そして、先ほど言ったように、将来的には、人間による制作スタジオや人間による執筆領域が、AIで生成されたコンテンツよりも、より速く安く作られたとしても、人間が作ったものに対する感情や性質のために、コスト効果が高くなるということは驚くべきことではありません。
他のニュースでは、Claudeが実際に注目すべきアップデートを受けました。彼らは実際に、チャットを共有可能な製品に整理できるようにするアップデートを追加しました。ここで見られるように、彼らはOpenAIのカスタムGPTsに非常に似たものを追加しました。
プロジェクトを作成し、あなたが正確に何を達成しようとしているのかを見ることができます。プロジェクトの作成をクリックすると、すべてのプロジェクト知識を含めることができ、それがロードされ、そしてこれを使用して異なる情報の断片を統合し、Claudeと話してカスタムレスポンスを得ることができます。
これは非常に効果的なものです。なぜなら、今やあなたのすべての情報を一つの特定の領域で使用でき、Claudeモデルと一貫したチャットを行うことができ、毎回異なるチャットをロードし続けるよりもずっと効率的だからです。
ここで見られるように、これで複数のチャットを持つことができ、これは基本的にClaude 3.5用のカスタムGPTsのようなものです。これはAnthropicがかなり長い間取り組んでいたものだと思われ、多くのユーザーがリクエストしていたこのような機能をリリースできたことを嬉しく思います。あなたがこれを使用するかどうか教えてください。
新しいOdax機能についてのチュートリアルがあります。現在、チャンネルで利用可能です。
また、MicrosoftのCEOであるMustafa Suanから重要な情報がありました。彼は実際にGPT-6について何かを述べています。クリックベイトだと思うかもしれませんが、決してそうではありません。

彼は「2年後のGPT-6になるまで、AIモデルは指示に従い、一貫した行動を取ることができるようにはならないだろう」と述べています。

これは注目すべき情報ですが、商標で見た時間軸と一致します。
彼の言葉を見てみましょう：

「これらのモデルに微妙なニュアンスを持つ指示に従わせ、長期間にわたって一貫した行動を取らせるのは、まだかなり難しいです。できると思いますし、Twitterなどで印象的な例が多くチェリーピックされていますが、新しい環境で一貫して行動させるのは本当に難しいです。モデルの学習に1桁ではなく、2桁の計算量が必要になると思います。つまり、GPT-5ではなく、むしろGPT-6スケールのモデルになるでしょう。本当に行動を起こすシステムができるまでには2年かかると思います。」

この情報が注目に値する理由は、私たちが持つ可能性のある機能について更新されたタイムラインを提供しているからです。彼が「まだかなり難しい」と言っているのが分かります。彼はモデルの知能について話しているのではなく、特定の空間や新しい環境で本質的に行動を起こす能力について話しているのです。
これは、短期的な環境、例えば閉ループや単に表を埋めるといった本当に簡単なことを行うことができるエージェントを得られない可能性があるという意味ではありません。彼が話しているのは、これらのエージェントが基本的にGPT-6に組み込まれるだろうということです。もし彼らがそれまでに物事をうまく動作させることができれば、です。なぜなら、現在のモデルでそれらのことを効果的に行うのは、はるかに長く、はるかに難しいからです。

私がこれも非常に興味深いと考える理由は、GPT-5にアクセスできず、実際の情報も全く持っていないのに、彼らがGPT-6スケールのモデルについて話し始めるのを聞くからです。これは、彼らが明らかにGPT-5に取り組んでおり、おそらくリリース日が近づいていることを示しています。

そして、このリリース日は、11月の直後から2025年1月にかけてのあたりだろうと私は予測しています。そのため、これがGPT-5が潜在的に表面化する可能性が非常に高いゴールディロックスゾーンになるでしょう。
そういうわけで、AIエージェントは多くの人が予想していたよりもはるかに難しいということは、非常に興味深いと思います。これは実際に、現在のAIエージェントの状況を見たときに私自身も予想していたことです。
私が気づいたことの一つは、例えばAdept AI Labsを見ているような、あなたが見たかもしれないこれらのブラウザエージェントの多くは、基本的にこれらのAIエージェントを作ろうとしている会社であり、彼らはかなり長い間インターネット上で沈黙を保っているということです。
彼らのモデルで何かができるようになったという投稿、例えば「11,000ドル以下の冷蔵庫を見つけて」というような、最後の情報提供の投稿が2022年頃にリリースされたのが分かります。これはGPT-3.5の時期でした。これは彼らのアクショントランスフォーマーモデルで、多くのソフトウェアツールの使用を教えました。
基本的に、これは「4人家族向けのヒューストンの家を見つけて」というようなもので、モデルが自分のビジョンモデルを使って、見つけられる家を検索したりするのが分かります。基本的にインターネットを検索しているのです。
これがかなり驚くべきことである理由は、これが彼らの最後の主要なアップデートで、約2年前のものだからです。Act 2やAct 1.5、より新しいモデルが全くないということは、この問題が非常に難しいことを示しています。
このモデルが一般に利用可能になれば、さまざまなAIツールの巨大な風景を完全に変えることは間違いないと思います。そして、おそらくオンラインで利用可能なAIシステムの完全な見直しが行われることでしょう。これが、平均的な人が「ワオ、AIが本当に本当にここにある」と気づく最終段階になると思います。
フロンティアモデルや、より大きく、より包括的なモデルを訓練している企業について話し続けるなら、実際にAIモデルの未来について洞察を与える非常に興味深いニュースがありました。

最近非常に印象的なモデルであるClaude 3.5 Sonnetを作成したAnthropicの研究所のCEOであるDario Amodが、Timeとの新しいインタビューでこれらのスケーリング法則について話しています。彼は、より多くの計算能力とより多くのデータでシステムを訓練すると、予測可能により有能または強力になるというスケーリング法則について話しています。

彼らは「まだリリースできないシステムでどのような能力を見たか」と尋ねられ、こう答えています。

「最後のモデルを比較的最近リリースしたので、1年分の未公開の秘密があるわけではありません。そして、それらがある程度あるとしても、私はそれらについて詳しく話すつもりはありません。しかし、進歩が続いていて、物事が平坦化している証拠は見られないと言えるほどには知っています。」

これは本質的に、シグモイド曲線の終わりに近づいていると考える人々にとっては、単にそうではないということを意味します。彼は続けて言います。

「私たちが生きている世界の現実は、いつでも止まる可能性があるということです。新しいモデルを訓練するたびに、私はそれを見て、常に疑問に思います。安心なのか心配なのか、いつか『ああ、モデルはもう良くならない』と気づく時が来るのではないかと。
スケーリングの効果が止まれば、ある意味で世界にとって良いことかもしれません。なぜなら、同時にすべての人を抑制することになるからです。しかし、それは私たちが選べることではありません。もちろん、モデルは多くのわくわくするメリットをもたらします。」

彼が言おうとしているのは、これらのモデルが実際に次のスケールレベルで全て止まったとしても、それは本当に悪いことではないということです。なぜなら、それによって誰もが減速し、モデルをより安全に構築し、もちろん終末的な競争条件を遅らせることになるからです。
しかし、現時点では物事が平坦化している証拠は見られないと言っています。つまり、これらのモデルは、生の処理能力、推論能力、そして次のレベルのシステムに対する私たちの要望の純粋な理解において、増加し続ける可能性が高いということです。
そして、チャットボットアリーナからの速報です。Claude 3.5 Sonetが実際にコーディングアリーナでGPT-4を追い抜き、現在GPT-4や他のフロンティアモデルと競争している全体的なGPTリーダーボードで1位タイになっています。
基本的に、これは私が話すべきだった最も重要な情報の一つです。これはFactory AI、つまり機械が機械を作る技術です。基本的に彼らがやりたいのは、自律型ソフトウェアエージェント、つまり自律型スイーを構築することです。彼らはソフトウェアエンジニアリングの質問に関して先頭に立つ新しいベンチマークを持っていることが分かります。
また、彼らはCA Capitalが主導する1500万ドルのシリーズAの新しい資金調達ラウンドを持っています。これは興味深いです。なぜなら、Devon Cognition Labsがこの分野で活動している唯一のソフトウェアエンジニアではないことを示しているからです。

GPT-6 ニュース、Suno と Udio が訴えられ、Sora が悪化、Claude がGPTsを開始、そしてその他のAIの進展...

彼は「2年後のGPT-6になるまで、AIモデルは指示に従い、一貫した行動を取ることができるようにはならないだろう」と述べています。

いいなと思ったら応援しよう！