【裏話編】ChatGPTブラウズ無効化の背景とOpenAIの試練
こんにちは!最近ヒューマンよりもジピちゃん(ChatGPT)と話している時間の方が多く、そろそろ人としてヤバイ気がしてきた、ChatGPT 飼育員の Sayah (@sayah_media)です🙃
今回は、ChatGPT の Web ブラウジング機能「ChatGPT Browse with Bing」をテーマに、3部構成でお送りしているシリーズの「Part 2. 裏話編」になります。
前作はコチラ👇
本シリーズの、各記事の概要は以下のとおりです。
本記事では、前作の「概要編」に続き、同機能が一時無効化されていた理由や背景、各メディアの対応、OpenAI の措置や対策などについて、詳細に分かりやすく解説するため、ぜひ参考にしてください。
⛔ 「ChatGPT Browse with Bing」無効化の背景とは
先日 ChatGPT に搭載された、Web ブラウジング機能の「ChatGPT Browse with Bing」 。
同機能は、今年5月12日(現地時間)にβ版*として実装され、有料ユーザーに順次開放されていました。
しかし、タイトルにも「一時無効化」とあるように、今から約3ヶ月前の7月3日(現地時間)には、「コンテンツ所有者の権利を侵害しかねない問題が発覚した」として、一時的に機能が廃止されてしまっていたのです。
次の章では、同機能が実装から2ヶ月も経たないうちに、一時無効に至った理由や背景について解説します。
🕳 なぜ約2ヶ月で無効に?その意外な落とし穴
前述のとおり、初めて「ChatGPT Browse with Bing β版」がロールアウトされたのは、今年5月12日(現地時間)のことです。
この Web ブラウジング機能を使えば、Microsoft の検索エンジン「Bing」を介して、ChatGPT にリアルタイムで最新情報を検索してもらうことができます。
ChatGPT が学習済みのデータは、当時2021年9月まで(現在は2022年1月)となっていたため、一部のユーザー間では、この画期的な機能の登場について、称賛の声や期待に胸を弾ませる声、好意的な意見などが飛び交っていました。
しかし、そこには想定外の落とし穴があったのです。
🙅♀️ Webブラウジング機能を悪用するユーザーが続出
「ChatGPT Browse with Bing」は、本来ならば多くの人々にとって便利で有用であるはずの機能です。一方で、実装後に同機能の抜け道を見つけ、悪用する人たちが出てきました。
米掲示板型ソーシャルニュースサイト「Reddit」の ChatGPT コミュニティ上では、非論理的なユーザーたちの間で、同機能を使った「サブスク課金せずに有料コンテンツの全文を見る裏ワザ」に関する情報交換が行われていたのです。
通常、ニュースサイトやブログの有料コンテンツは、ペイウォール(Pay Wall)*で保護されており、記事を購入した人かサブスクメンバーしか見られない仕組みとなっています。
しかし当時、『The Wall Street Journal』や『The New York Times』などの米大手メディアを筆頭に、本来無料では見られない有料記事でも、ChatGPT の Web ブラウジング機能を使えば全文が表示されるという不測の事態が起きていました。
(かくいう私も、実は本国版『The New York Times』の購読者です←)
上記のとおり、同機能を悪用し、不正行為を行うユーザーが続出したため、OpenAI は問題が解決するまでの間、Web ブラウジング機能を一時無効にするという重大な決断を下しました。
この影響は決して軽微ではなく、安全性や倫理性、プライバシーの尊重を重んじる OpenAI にとっても、品質と信頼性を保つための大きな試練となりました。
📰 『New York Times』がOpenAIのクローラーを出禁に
この問題を受けて、米『The New York Times』は、8月頭に利用規約を更新し、AI モデルのトレーニングや開発における、自社コンテンツの使用を禁じる項を追加しました (Peters, 2023)。
また、8月17日(現地時間)には、同メディアの「robots.txt」で、OpenAI のクローラーである「GPTBot」のアクセスを拒否する旨が、明確に記載されています (Peters, 2023)。
特定のクローラーが自社サイトを巡回するのを回避したい場合は、自社サイトの「robots.txt」というファイルに、該当のクローラーを識別する名前を書くことでアク禁可能です。
執筆時に『The New York Times』の「robots.txt」を確認したところ、今もなお GPTBot を拒否する旨が明示されていました(10月10日時点)。
『The New York Times』に限らず、9月22日時点では、Amazon、CNN、 Reuters、Shutterstock、Pinterest、Indeed、The Washington Post、CBS などの大手メディアやECサイト、放送ネットワークが、GPTBot のアクセスを拒否している状況です (Gillham, 2023)。
🚨OpenAIが取った措置やセキュリティ対策
このような事態を受けて、Web ブラウジング機能の一時無効化以外にも、OpenAI はさまざまな措置やセキュリティ対策を講じています。
7月3日(現地時間)には、OpenAI の公式サイトにあるヘルプページ「OpenAI Help Center」上に、以下のコメントが投稿されました。
また、8月7日に OpenAI は、Webサイト・メディア運営者に向け、「GPTBot のクローリングをブロックする方法」および「一部のページのみ許可あるいは拒否する方法」に関する説明を、公式サイトの『GPTBot』ページ内に追記しています。
ちなみに、世界のトップ100 にランクインしている Webサイトのうち、最も迅速に GPTBot をアクセス拒否したサイトは『Reuters(ロイター)』です。
同メディアは、まるで今回の事態を想定していたかのようなスピード感で、OpenAI が GPTBot のブロック方法を発表した翌日に、GPTBot をブロックしています (Gillham, 2023)。
✅ 今回の復活はセキュリティ問題の解決を示唆?
ただし、前述のブロック対策は、問題の根本的な解決ではなく、あくまでも応急処置的なものでした。また、GPTBot のアクセス拒否は、サイト運営者側が個々に判断し、各自で行う必要があります。
この問題が明るみになったとき、何よりもセキュリティやセーフティを重んじている OpenAI は、現在の状況や経緯、コンテンツ所有者を尊重し、Webブラウジング機能を一時無効化することなどについて、X(旧・Twitter)上でポスト(旧・ツイート)しました。
今回の措置(Webブラウジング機能の無効化)がいつまで続くのかに関して、OpenAI は具体的な日時は明記せずに「この問題の修復中はブラウズを無効にします」とだけ述べ、問題が解決するまではブラウジング機能を復活しない旨を暗に示しました (OpenAI, 2023b)。
つまり、裏を返せば、今回 OpenAI が 3ヶ月ぶりに Webブラウジング機能を再開したという事実は、上記のようなセキュリティ問題が解決された証ともいえるのではないでしょうか。
📝 【裏話編】「ChatGPT Browse with Bing」まとめ
AI 技術が進化し続ける現代、個人情報や機密データの漏えい、著作権の侵害、誤情報やフェイクニュースの拡散、今回のような不正行為や詐欺への悪用など、AI に関する課題や懸念の声を耳にしない日はありません。
その中でも、ユーザーにとって深刻な課題の1つに、AI モデルが「知ったかぶり」や「でっちあげ」をして誤情報を生成してしまう、「ハルシネーション(Hallucination:幻覚)」と呼ばれる現象があります。
ただし、今回復活した Webブラウジング機能では、参照したソースへのリンクも提供されるため、ユーザー自身が情報の正確性を確認することが可能です。
今回の進歩は、一見「Baby steps👣」と呼ばれるような、赤ちゃんの歩幅くらいの、ほんのわずかな一歩に感じる方もいるかもしれません。
しかし、そんな小さなステップでも、私たちが夢やゲーム、SF 映画でしか観たことのなかった近未来の世界の実現へと、AI は 一歩一歩確実に歩みを進めています。
このようなテクノロジーの進化を受け、人間も AI と共に経験値を1つひとつ積み上げていくことが、後々 AI に対する「信用性や安全性の確保」や「偽情報や誤情報に対する懸念の解消」などに、つながっていくのではないでしょうか🌈
次回の記事「実践編」はコチラ。
📚 References
Bogle, A. (2023, August 25). New York Times, CNN and Australia’s ABC block OpenAI’s GPTBot web crawler from accessing content. The Guardian. https://www.theguardian.com/technology/2023/aug/25/new-york-times-cnn-and-abc-block-openais-gptbot-web-crawler-from-scraping-content
Gillham, J. (2023, September 22). Websites that have blocked OpenAI’s GPTBOT CCBot Anthropic Google Extended - 1000 website study. Originality.AI. https://originality.ai/blog/study-websites-blocking-gptbot
OpenAI [@OpenAI]. (2023-b, July 4). We've learned that ChatGPT's "Browse" beta can occasionally display content in ways we don't want, e.g. if a user specifically [Post]. X. https://x.com/OpenAI/status/1676072388436594688?s=20
OpenAI. (n.d.). GPTBot. OpenAI API. https://platform.openai.com/docs/gptbot
Peters, J., & Davis, W. (2023, August 21). The New York Times Blocks OpenAI’s Web Crawler. The Verge. https://www.theverge.com/2023/8/21/23840705/new-york-times-openai-web-crawler-ai-gpt
Schade, M. (2023, July 3). How Do I Use ChatGPT Browse with Bing to Search the Web? OpenAI Help Center. https://help.openai.com/en/articles/8077698-how-do-i-use-chatgpt-browse-with-bing-to-search-the-web
Taylor, J. (2023, August 8). Google says AI systems should be able to mine publishers’ work unless companies opt out. The Guardian. https://www.theguardian.com/technology/2023/aug/09/google-says-ai-systems-should-be-able-to-mine-publishers-work-unless-companies-opt-out