![見出し画像](https://assets.st-note.com/production/uploads/images/71779334/rectangle_large_type_2_d5d336e10137d6741340fd8a0e8e63b7.png?width=1200)
Google 「Topics」とは?|3rd Party Cookie の廃止と「FLoC」の問題点
こんにちは。UltraImpression の技術担当です。
(UltraImpression については、最後に紹介させていただきます)
さて、Topics について説明する前に、まず全体的なデータ規制の流れから説明したいと思います。
データの取り扱いについての法規制・技術規制の流れ
2017年頃からユーザーのプライバシーを重視した規制が始まりました。
そして、2023年後半には Google Chrome において、3rd Party Cookie の削除が予定されています。
![](https://assets.st-note.com/img/1644066219904-oYzZc2ct8q.png?width=1200)
そして、Google はその代替技術として、プライバシー保護と広告での収益を両立できる新技術「Privacy Sandbox(プライバシーサンドボックス)」を提唱しました。
そして、その「Privacy Sandbox」の1つとして、2021年3月に発表されたのが「FLoC API」です。
FLoCとは?
FLoC(Federated Learning of Cohorts)とは、ユーザーが使用するブラウザにおけるWeb上の行動履歴をもとに、似ている行動を取っているブラウザを、7日間毎に数千ブラウザ単位でグルーピングする技術です。このグループ単位をコホートといい、Webサイトおよび広告配信プラットフォームには、そのグループID(コホートID)だけを渡す、という仕組みです。
Webサイトや広告配信プラットフォームには、グループIDだけが渡されるので、そのグループの中に含まれる誰かを特定することはできないので、プライバシー保護になる、という思想でした。
![](https://assets.st-note.com/img/1644066652115-vw03MrPTt4.png?width=1200)
上の画像のようなコホート空間において、ある期間では同じコホートに属していたとしても、行動履歴の傾向が変われば、また別のコホートに移ることになります。
FLoCの問題点
一見、高いプライバシー保護を実現しているように見えますが、その技術が公開されて以降、様々な団体やグループが検証を行い、FLoC が多数の問題を抱えていることがわかってきました。
より個人が特定しやすくなっているケースがある
Cookie の代替技術として発案されていたが、Cookie を使わないトラッキング技術であるフィンガープリントを使うと、今までより個人の追跡がしやすくなっている、という指摘がありました。
フィンガープリントとは「ブラウザの種類・バージョン・IPアドレス・使用言語・インストール済みプラグイン・画面の解像度・OSのバージョン...etc」など、ブラウザから取得できる情報の組み合わせで、ユーザーを特定する手法です。
数億のブラウザを対象としているため、1つのブラウザを特定できる Cookie と違い、フィンガープリントの情報が同じ組み合わせになっている人もそこそこいるので、完全に個人を特定できない場合がある、というのが特徴でした。
一方、FLoCが導入されると、Google が "数千人単位のグループ" を作ってくれるので、コホートID x フィンガープリントで、数千人の中でフィンガープリントの組み合わせを見るだけで良くなり、今までより個人を特定しやすくなってしまいました。
強者を更に強く。 弱者を更に弱く。
Webサイトとブラウザは、コホートIDのみをやり取りしますが、ログインするサイトは、フィンガープリントを使うまでもなく、個人とコホートIDを紐付けることができます。
FLoCは7日毎にコホートIDが変わる可能性がありますが、ログインサイトは、その個人がどのようにコホートIDが変化していったかを追跡できるので、今までCookie でわからなかったことすらわかるようになってしまいました。
また、大量のユーザーと大量の情報を持っているサイトが、より有利になることがわかりました。
例えば、小さな靴専門のECサイトがあった時に、そのサイトはユーザーが来る度にそのブラウザのコホートIDを確認していきます。
![](https://assets.st-note.com/img/1644217360022-klld7IFx8R.png?width=1200)
# 1101 のコホートIDを持つブラウザからたくさんアクセスがあることがわかったので、# 1101 は靴が好きなユーザーが集まっているグループだとわかります。一方で、それ以外のコホートIDに関しては、どういう興味関心があるかは、断定できません。
それに対して、Aamazon などの大量のユーザーかつ多種多様な商品に関する閲覧・購入履歴を持っているWebサイトは、多くのコホートIDと興味関心を紐付けることができるのです。
そして、世界で最も正確に、かつ多くのコホートIDの興味関心を紐付けることができるのが、何を隠そう Google なのです。
結果として強者は更に強く、そしてGoogle が、広告市場において今まで以上に圧倒的に優位な地位に立つことになるのです。
Topics とは?
ここからが、今回の主題です。
Google は FLoC のテストをしていく中で、世界中から来たフィードバックに基づいて、「Topics API」を FLoC に変わるものとして開発し、2022年1月25日に発表しました。
※以下は、こちらを参照して、内容を抜粋したものです。
ブラウザがサポートするべきと考えているユースケースの1つが「インタレストベース広告」です。
インタレストベース広告
インタレストベース広告(Interest-Based Advertising = IBA)は、パーソナライズド広告の一種です。
ユーザーが過去に訪問したサイトから得られる興味に基づいて広告が選択されます。
これは、現在閲覧している(広告を掲載している)サイトの内容から導くコンテキスト広告とは異なります。
メリットは、ユーザーにとって有益でありながら、コンテキスト広告では収益化が難しいサイトでも、他の方法よりも関連性が高い広告をユーザーに表示できます。
![](https://assets.st-note.com/img/1644129065823-sz3oeXG2vf.png?width=1200)
Topics APIのポイント
トピックへの分類方法
ユーザーが来訪した各Webサイトが何の「トピック」について扱っているかを、URLのドメインから分類します。
分類にはサイトのドメインのみを利用し、サイトの内容(コンテキスト)は一切使いません。
例えば、tennis.example.com だったら、トピックは「テニス」です。
このサイトのトピックへの分類については、外部パートナーによって構築され、時間の経過と共に改善される予定です。
また、メタタグやヘッダー、Javascript を使って、サイトが独自のトピックを提供することも可能になる予定ですが、これは未解決の問題です。
トピックの分類数
最初は350程度からテストをスタートし、最終的には数百から数千にする予定です。
参考までに、IAB(Interactive Advertising Bureau)のAudience Taxonomy は1,500程度です。
トピックの選択
ブラウザはユーザーの3週間分の閲覧履歴から、1週間毎に1つのトピックを選択し、最終的には3つのトピックを選択します。
その1つを選ぶプロセスは、1週間の行動履歴から、訪れたサイトの上位5つのトピックを抽出します。そこに、ランダムに選んだトピックの1つを加え、全部で6つのトピックを用意します。
その中から1つ選ぶ、という作業を3週間分行い、3つのトピックを選択します。
![](https://assets.st-note.com/img/1644366131030-7ZDFua6nQV.png?width=1200)
なお、各サイトが同じブラウザからとるトピックは異なるので、各サイト間では同一人物と紐付けできない、という特徴があるそうです。
また、5%の確率でランダムトピックが選ばれるので、k-匿名性を確保することができます。
![](https://assets.st-note.com/img/1644133130724-gW3lWBT9Cl.png?width=1200)
参照:Get to know the new Topics API for Privacy Sandbox
ユーザー目線については、ブラウザの設定で自分が何のトピックを持っているか閲覧でき、かつ削除できるようにする予定です。
これにより、自分が見たい広告をある程度コントロールすることが可能になります。
まとめ
以上が、先日Google が「Topics API」を発表した経緯と概要となります。
これから、世界中の関係者が、このAPIについて検証を行い、FLoCの問題点を改善できたのか、3rd party cookie の代替技術として成立するのか、プライバシーに問題ないか、などが確認されていきます。
早速、一部の業界からは賛否の声が出ているようです。
FLoCよりはるかに透明性のある技術で、正しい方向への一歩に見えるという意見や、直近3週間の最新の興味関心が反映されることはユーザーにとっては有益になる、という声もありつつ、一方で精緻なターゲティングができなくなるので、パフォーマンスが低下する、という懸念の声も聞こえてきています。
引き続き、最新情報を追っていければと思います。
UltraImpression とは?
最後に、UltraImpression の紹介をさせて下さい。
国内では初となる「テレビ局主体の動画広告配信プラットフォーム」を運用・構築する会社です。
主に TVer などのプレミアムな広告枠に広告配信を行っています。
TVer での広告出稿などに興味がある方は、下記サイトよりお問い合わせ下さい。