ブランド・バイヤーの成功を支える生成AI・レコメンド技術 - 最高の検索体験を目指して
グッズは、商品を購入するバイヤーと、商品を販売するセラーの、マッチングプラットフォームです。このセクションでは、特に、サイト上でのバイヤーの体験について、解説します。以下では、ユーザーとは、バイヤーのことを指すことにします。
グッズは、ユーザーに対して「検索条件(クエリ)を入力することなく、サイトを訪れるだけで、欲しいものが見つかる。新しい発見がある。」という検索体験の提供を目指しています。
なぜなら、ユーザー観察およびデータ分析の結果、探しているものを検索条件として表現するのが難しいことがわかったためです。というのも、グッズのユーザーは、オリジナリティあふれるショップを運営しており、取り扱うアイテムも、多様かつ個性的なものが多くなります。また、グッズで取り扱われる商品は、趣向を凝らしたものが多く、一言で言い表すこと自体が困難です。
この課題に対応するため、グッズでは、レコメンド(提案)-レスポンス(反応)型の検索体験を提供しています。
システムは、積極的に、ユーザーの趣味趣向を推論して、おすすめの商品や検索条件を提案します。ユーザーは、これらの提案に反応することによって、探索を進めます。こうすることで、ユーザー自身が検索条件を設定する必要がある従来の検索システムに比べて、検索開始までの負荷を軽減でき、ユーザー体験を大きく改善することができます。
グッズの検索を支える技術
以下では、グッズの目指す「提案-反応型の検索体験」を支える主な技術要素について紹介します。
① 提案のための生成 AI
ユーザーがサイトを訪れた瞬間に提案を行うには、ユーザーの好みを反映した検索条件を事前に準備しておく必要があります。グッズでは、この目的で生成 AI を活用しています。
生成AIとは、テキスト、画像、音声、ビデオなどの新しいコンテンツを自動的に作り出すAI技術一般を指しますが、グッズでは、OpenAI 社の ChatGPT のような、テキストを生成するものをメインで利用しています。
例えば、ユーザープロフィール情報として、ウェブサイトのURLが事前に登録されています。これを生成 AI に読み込ませ、キーワードやフレーズとして生成し、ユーザーがサイトを訪れた際、提案に用いる検索条件として利用しています。
この例から、自社サイトの特徴を表す様々な側面を、改めて言語化するのが難しいことが想像できるのではないかと思います。グッズでは、その負荷を生成 AI により解消しています。
また、ウェブサイトだけでなく、画像データなどにも同様の処理が施され、あらゆる情報がテキストデータに変換され、ユーザーへの提案の元となる検索条件として獲得されます。
② 大規模言語モデルによるベクタ化とハイブリッド検索
① で生成した、検索条件の候補は、様々な言い回しが存在するため、従来のキーワード検索を行うだけでは、ヒット率が低くなりがちです。例えば、「エシカル」という検索条件を入力した場合、「倫理的」というキーワードとは別物として認識され、検索結果に含まれません。表記揺れに弱い仕組みであると言えます。
グッズの検索基盤では、検索の対象となるあらゆるオブジェクトが、生成 AI によってテキストに変換され、大規模言語モデル(エンべディングモデル)によって、ベクタ化(数値化)されます。このベクタは、表記が異なっていても、意味的に似ていれば、近い値を取ることが期待できます。
ベクタ化(数値化)により、数学的な操作が容易になります。基本的なものとしては、ベクタどうしの類似度や距離を計算できるようになります。ベクタ検索では、ベクタ間の距離に基づいて、検索結果を獲得します。意味的な近さで検索できるため、表記揺れに弱いというキーワード検索の課題を解決することができます。
ベクタ検索の優位性について述べてきましたが、キーワード検索は、マッチした際の適合率が高いという利点もあるため、グッズでは、キーワード検索とベクタ検索を併用した、ハイブリッド検索を採用しています。
③ 最適化しやすくデザインされたユーザーインタフェース
生成される提案の候補は複数あり、それらの優先度を、ユーザーの反応から最適化する必要があります。そのため、ユーザーインタフェースが、最適化を想定したデザインになっていることが重要です。
例えば、グッズのログイン後のトップページの UI は、次のようになっており、ユーザーの反応を加味して、提案の並べ替えが容易にできるようなデザインになっています。
提案の優先度付けは、様々な定式化がありますが、現在は、バンディット問題として定式化しています。アルゴリズムとしては、ε-greedy、トンプソンサンプリングなど、シンプルなものから投入し、A/Bテストをしながら磨き込んでいます。
おわりに
グッズでは、これまで説明してきた、検索基盤だけでなく、コンテンツフィルタリング、協調フィルタリングなどのレコメンデーションなど、デファクトである技術も実装されています。
今後も、データパイプラインの洗練、適切な生成AIモデルの探索、各種アルゴリズムの磨き込み、を継続しよりよいユーザー体験につなげていきます。また、解説してきたバイヤー体験だけではなく、セラーサイドの体験向上や、セラーファイナンスの支援など、幅広い領域で AI プロダクトを提供していく予定です。