OpenAIから出された声明：「データとAIに対する当社のアプローチ」

2024年5月8日 02:54

なぜか唐突に、OpenAIが「目指す方向について詳しく説明」するページが登場しましたので、このページの要約と検証をしていきたいと思います。

Our approach to content and data in the age of AI: https://t.co/iZto8wmiAs
— OpenAI (@OpenAI) May 7, 2024

「OpenAIが目指す方向について」要約

AIの可能性を拡大する

AIシステムは情報を新しい方法で変換し、問題解決や自己表現を支援します。例えば、ケニアやインドの農業労働者が作物の収穫量を増やすためにChatGPTを使用しています。また、モデルナ社では、薬の発見を加速させるためにAIツールが使用されています。教育者は学生の学習を促進し、視覚障害者は「Be My Eyes」を通じてよりよく世界をナビゲートできるようになります。

OpenAIの使命と社会契約

私たちの使命は、すべての人類に利益をもたらすことです。これにはユーザーだけでなく、クリエイターや出版者も含まれます。AI時代のコンテンツに関する広く有益な社会契約の発展に寄与することが重要です。

クリエイターとコンテンツ所有者への尊重

AIシステムは、クリエイターとコンテンツ所有者の選択を尊重し、彼らに利益をもたらすべきです。私たちは、コンテンツ所有者の好みを反映するために業界をリードするシステムを継続的に改善しています。

メディアマネージャーの構築

コンテンツ所有者が自分の作品をどのようにAIの研究や訓練に含めるか、または除外するかを指定できるようにするために、「メディアマネージャー」というツールを開発しています。これには、著作権があるテキスト、画像、オーディオ、ビデオを特定し、クリエイターの好みを反映するための最先端の機械学習研究が必要です。

パートナーシップを通じた革新

広告主ではなくユーザーを中心にした注意経済を変えることを目指しています。最近では、ChatGPTにおけるソースリンクを改善し、ユーザーにより良いコンテキストを提供し、ウェブ出版者が新たな方法で視聴者とつながる手助けをしています。

基盤モデルの理解

私たちはAIモデルを学習マシンとして設計していますが、データベースではありません。トレーニングプロセスが完了すると、AIモデルはトレーニング中に分析したデータへのアクセスを保持しません。ChatGPTは、多くの学習を通じて概念間の関係を学んだ教師のような存在です。

広範囲かつ多様なデータの利用

私たちのAIモデルは、できるだけ多くの言語、文化、主題、業界から学ぶことを目指しています。データセットが多様であればあるほど、モデルの知識、理解、言語能力が豊かになります。これは、多文化の視点と経験にさらされた人のようなもので、AIがより多くの人々と国々に安全に奉仕することが可能になります。

新世代の基盤モデルのトレーニング

私たちは、新しいデータセットを用いて、各世代の基盤モデルを一からトレーニングします。私たちはアーキテクチャを改善し、以前のモデルよりもはるかに規模と多様性を増したデータセットを用いています。私たちは大企業とは異なり、何十年にもわたる大量のデータを保有していません。私たちは主に公開情報に依存して、モデルがどのように役立つかを教えています。

パートナーシップと協力

AIは急速に進化しており、私たちの目標を単独で達成することはできません。私たちは、クリエイターや出版者との協力を通じて、相互に有益なパートナーシップを築き、健全なエコシステムを支援し、新しい経済モデルを探求しています。私たちは、これらの重要なテーマに取り組んでくれているユーザーやパートナーに感謝しています。

「OpenAIが目指す方向について」解説

AIの可能性を拡大する

「Be My Eyes」とは視覚障害のある人々を支援するためのモバイルアプリで、視覚障害者がスマートフォンのカメラを通じて見ているものを、視覚が健常なボランティアがリアルタイムで見て、説明やガイダンスを提供することができるようにするものです。

このアプリは、視覚障害者が日常生活で直面する様々な課題を解決するのに役立ちます。例えば、賞味期限の確認、製品のラベル読み取り、街中でのナビゲーションなど、視覚に依存する情報を必要とする場面でのサポートが提供されます。

「Be My Eyes」は、技術を利用して社会的な課題に取り組む素晴らしい例であり、世界中で多くの人々に支持されているプロジェクトの一つです。

OpenAIの使命と社会契約

これについては、以前明確にAGIを世に出す目的をCEOサム・アルトマンと社長グレッグ・ブロックマンが明確にしたポストについて解説したNoteがありますので、合わせてご覧ください。

クリエイターとコンテンツ所有者への尊重

クリエイターやコンテンツ所有者が自らの作品をどのようにAIの研究やトレーニングに使用されるかを管理できるようにするためのツールを開発しているというOpenAIの取り組みに関するものです。これは、著作権で保護されたテキスト、画像、音声、ビデオを識別し、クリエイターの好みを反映するための、業界初のツールを構築することを要求します。

メディアマネージャーの構築

「Media Manager」について解説します。
ツールの目的: 「Media Manager」というツールは、クリエイターやコンテンツの所有者が自分の作品についてどのように情報を提供し、その作品がAIのトレーニングや研究にどのように使用されるかを指定できるようにすることを目的としています。これにより、クリエイターは自らの著作権をより効果的に管理できるようになります。

技術的挑戦: このツールの開発には先進的な機械学習の研究が必要であり、多くの異なるソースから著作権で保護されたコンテンツを特定し、クリエイターの好みに応じてこれを反映させる必要があります。
法的および倫理的配慮: AIのトレーニングに使用されるコンテンツの管理は、著作権法や個人の権利を尊重することが非常に重要です。不適切なコンテンツの使用は法的な問題につながり得るため、このツールはそれを防ぐための一環として位置づけられています。
業界への影響: OpenAIは2025年までにこのツールを実装する計画であり、AI業界全体における標準を設定することを目指しています。これは、他のAI企業にも同様の倫理的配慮を促す可能性があります。

この取り組みは、AIが人々のクリエイティブな作品をどのように扱うかという点で、業界全体の標準を高め、クリエイターの権利を尊重する新たな枠組みを築くことを目指しています。

パートナーシップを通じた革新

この部分では、現在の広告主中心の注意経済に対する批判と、AIを用いてこの状況を変えるというOpenAIの野心について語られています。特に、クリエーターや出版者を強化し、ユーザー体験を向上させることを目指している点が強調されています。このセクションでは、AIがどのようにしてより健全なエコシステムを支援し、新しい経済モデルを探求するかに焦点を当てています。以下、原文を引用しておきます。

Today, we live in an attention economy built for advertisers over users and quantity over quality. Our ambition is to use AI to change this: to empower creators and publishers and to enhance the user experience.

今日、私たちはユーザーよりも広告主のために、質よりも量のために構築された注目の経済の中に生きています。私たちの目標は、AI を使用してこの状況を変え、クリエイターとパブリッシャーに力を与え、ユーザーエクスペリエンスを向上させることです。

GoogleやMETA（以前のFacebook）などの大手テクノロジー企業が構築した広告ベースのビジネスモデルは、インターネット経済の大きな部分を占めています。これらのモデルは、ユーザーの注意を引きつけて広告収入を最大化することに重点を置いており、しばしば「注意経済」と呼ばれます。これにより、コンテンツの量が質を上回る傾向があり、ユーザー体験が二の次にされがちです。

OpenAIのような組織がAI技術を利用してこの状況を変えようとしているのは、非常に重要な動きです。AIを使ってクリエイターや出版者を支援し、より質の高いコンテンツを提供することで、ユーザー体験を向上させることが目標です。これにより、よりバランスの取れたエコシステムが生まれ、クリエイターや出版者、ユーザーすべてにとってのメリットが増大します。

このような取り組みは、広告に依存しない新しいビジネスモデルの可能性を示しており、インターネットの未来において重要な役割を果たす可能性があります。

基盤モデルの理解

このセクションでは、AIモデルがどのようにして新しいコンテンツやアイデアを生成するために設計されているか、そして単に既存のコンテンツを繰り返すものではないという点に焦点を当てて説明しています。また、トレーニングプロセスや出力で最先端の技術を用いて内容の繰り返しを防ぐ取り組みについても触れています。その事について満足を表明したリポストを引用しておきます。

Liked reading this part

"Our models are designed to help us generate new content and ideas – not to repeat or “regurgitate” content. AI models can state facts, which are in the public domain. If on rare occasions a model inadvertently repeats expressive content, it is a failure…
— Rohan Paul (@rohanpaul_ai) May 7, 2024

この部分を読んでよかった
「当社のモデルは、新しいコンテンツやアイデアの生成を支援するために設計されており、コンテンツを繰り返したり「反芻」したりするためのものではありません。AI モデルは、パブリックドメインにある事実を述べることができます。まれに、モデルが表現コンテンツをうっかり繰り返してしまう場合、それは機械学習プロセスの失敗です。この失敗は、頻繁に引用されるためにさまざまなパブリック Web サイトに表示されるコンテンツなど、トレーニングデータセットに頻繁に表示されるコンテンツで発生する可能性が高くなります。当社は、繰り返しを防ぐために、トレーニング全体と出力時に API または ChatGPT の最先端の技術を採用しており、継続的な研究開発で継続的に改善を行っています。」

広範囲かつ多様なデータの利用

日本法人がChatGPTの日本語カスタムモデルを制作していることは、その一環と見ることができます。これにより、日本語のニュアンスや文化的背景をより深く理解し、日本のユーザーにとってより有用で正確なレスポンスを提供できるようになるでしょう。

OpenAIの日本法人の取り組みについては下記のNoteで詳しくまとめていますので合わせてご覧ください。

将来的には、このような取り組みが他の言語や地域にも拡大されることが期待されます。各国の言語や文化に特化したモデルを開発することで、グローバルな規模でAIの有用性を向上させ、多様なユーザーのニーズに応えることが可能になると考えられます。これは、AIが世界中のさまざまな言語や文化を尊重し、サポートするための重要なステップです。

新世代の基盤モデルのトレーニング

モデルの学習方法について補足したリポストがあったので引用しておきます。

Unpopular opinion but I think AI is no different than a film student watching the great movies and using them as inspiration. AI isn't copying it directly and should be allowed to train on ALL media. Are filmmakers sued when they flat out say they used XXX as an inspiration? No.
— Ripper (@RipperFromYT) May 7, 2024

不人気な意見ですが、AI は映画の学生が素晴らしい映画を見てインスピレーションとして利用するのと何ら変わらないと思います。 AI は直接コピーしているわけではないため、すべてのメディアでのトレーニングを許可する必要があります。映画製作者が、XXXをインスピレーションとして使用したと公言したら、訴えられるのでしょうか？いいえ。

パートナーシップと協力

OpenAIは、様々なメディアおよび教育機関とのパートナーシップを築いています。具体的な例をいくつか挙げると、以下のようなものがあります：

Le MondeおよびPrisa Media: これらのパートナーシップを通じて、ChatGPTは世界中のニュースコンテンツにアクセスし、それを利用者に提供することが可能になります。Le Mondeとの連携は、信頼性の高い情報をAIユーザーに提供し、ジャーナリスティックな整合性と収益の流れを守るための戦略的な動きです。
Axel Springer: Axel Springerとのグローバルパートナーシップは、独立したジャーナリズムを人工知能の時代に強化することを目指しています。この取り組みにより、ChatGPTのユーザー体験が豊かになり、幅広い話題に関する最新で権威あるコンテンツが提供されます。
Common Sense Media: Common Sense Mediaとのパートナーシップは、AIを安全に活用するためのガイドラインや教育資料を提供し、ティーンや家族がAIの潜在能力を安全に活用できるよう支援することを目的としています。
アリゾナ州立大学 (ASU): ASUとのコラボレーションは、教育プログラムにChatGPT Enterpriseを導入することで、教育、学習、発見を強化することを目指しています。この取り組みは、教職員がAIの可能性を探求するのを助けるとともに、プライバシーとセキュリティを高めています。

また、OpenAIがStack OverflowとAPI連携を開始したことも重要なパートナーシップです。この連携により、開発者はStack Overflowの技術的な情報とOpenAIのAIモデルを活用して、問題解決を迅速に行い、優先課題に集中できるようになります。詳細は下記のNoteで詳しく解説しましたので合わせてご覧ください。

OpenAIから出された声明：「データとAIに対する当社のアプローチ」

「OpenAIが目指す方向について」要約

AIの可能性を拡大する

OpenAIの使命と社会契約

クリエイターとコンテンツ所有者への尊重

メディアマネージャーの構築

パートナーシップを通じた革新

基盤モデルの理解

広範囲かつ多様なデータの利用

新世代の基盤モデルのトレーニング

パートナーシップと協力

「OpenAIが目指す方向について」解説

AIの可能性を拡大する

OpenAIの使命と社会契約

クリエイターとコンテンツ所有者への尊重

メディアマネージャーの構築

パートナーシップを通じた革新

基盤モデルの理解

広範囲かつ多様なデータの利用

新世代の基盤モデルのトレーニング

パートナーシップと協力

いいなと思ったら応援しよう！