見出し画像

Soraの学習データにYouTubeが含まれている場合は?YouTubeCEOの回答

ブルームバーグのエミリー・チャン氏はYouTube の最高経営責任者 Neal Mohan 氏に対して、以前OpenAI CTOのミラ・ムラティ氏へのインタビューで、Soraの学習データにYoutubeが含まれているのかどうかわからないと答えたことに対して質問しました。ミラ・ムラティ氏のインタビューの解説Noteはこちらをご覧ください。

では動画の文字起こしを自然な日本語で翻訳していきます。

エミリー・チャン:OpenAIのCTO、ミラ・モラディがSoraのトレーニングに使用されたデータについて問われましたが、彼女は明確な回答をしませんでした。YouTubeがSoraのトレーニングに使用されたと思いますか?

Neal Mohan:ええと、わかりません。まず彼らが問われたと思いますが、あなたが彼らに尋ねる必要があるでしょう。YouTubeが使われたかもしれないという報告を見たことがありますが、自分自身では情報はありません。直接彼らに尋ねることをお勧めします。

エミリー・チャン:もしYouTubeが使用されていたとしたら、それはあなた方のポリシーに反することになりますか?

Neal Mohan:それは反するでしょう。私たちには明確な利用規約があります。クリエイターが彼らの作品を私たちのプラットフォームにアップロードするとき、彼らにはある期待があります。その期待の一つが、利用規約が守られることです。私たちの利用規約は、YouTubeのコンテンツの一部、例えばビデオのタイトルやチャンネル名、クリエイターの名前をスクレイピングすることを許可しています。それはオープンウェブを通じてそのコンテンツが表示され、他の検索エンジンなどで表示され、利用可能になる方法です。しかし、トランスクリプトやビデオの断片をダウンロードすることは許可されておらず、これは私たちの利用規約の明確な違反です。これが私たちのプラットフォーム上のコンテンツに関するルールです。

エミリー・チャン:内部的にはどのように機能していますか?GoogleはYouTubeを使ってGeminiをトレーニングしていますか?

Neal Mohan:Googleは、YouTubeのコンテンツを、再び利用規約や私たちがクリエイターやアップローダーと結んだ個別の契約に基づいて使用しています。多くのクリエイターが私たちのプラットフォーム上で異なる種類のライセンス契約を持っています。そのため、YouTubeコーパスの一部がそれらのモデルに使用されているかもしれませんが、それはそのクリエイターがYouTubeにコンテンツをアップロードする前に署名した利用規約や契約に従って行われます。

エミリー・チャン:YouTubeはクリエイターの知的財産を保護し、その対価を支払うためにどのように取り組んでいますか?

Neal Mohan:非常に良い質問です。多くは私たちの基本的な利用規約と、そこでのルールから始まります。それが、彼らのコンテンツがどのように使用されるか、スクレイピングされるべきでないかなどについてです。しかし、私は一歩引いて、AI技術がYouTubeプラットフォームにどのように現れるかを考えるとき、それは最終的に私たちのプラットフォームでクリエイターを成功させること、魔法のような体験を構築することについてのコアミッションに戻ると言いたいです。


要するに、Neal Mohan氏は学習データがyoutube動画をダウンロードして行われた物であればそれは明らかな禁止事項違反で有ると言う事と、GoogleのAIであるGEMINIの学習データに使う事に対しては禁止事項ではないと言う事を明確にしています。

いいなと思ったら応援しよう!