How Query Cost Affects Search Behavior
本記事の紹介
現在,修士論文の仕上げと国際会議への論文提出を並行しつつ,来年度の博士後期に向けてテーマを教授と詰めているところである.
詳細は割愛するが,検索コストとの関係性を見ても面白いかもしれないねということとなり,着想を得るために,関連する論文を精読しているところである.
次週,自分の研究を発表しないといけないが,特にネタがない..
というわけで,今回読んだ論文を発表用資料としてまとめたので,それを公開する.
Leif AzzopardiさんのHow Query Cost Affects Search Behaviorである.
内容
詳しくはスライドを参照されたい.
平たくいうと,ユーザのクエリに関連するコストと,検索行動をモデル化したので,それを実証実験してみるという論文だ.
どのようなモデルかというと
クエリコストが増加すると,ユーザはより少ないクエリ発行数となり,1回のクエリで多くの文章を調査すると言うコスト-インタラクション仮説をベースとしたモデルだ.
個人的に面白いなと思ったポイントは,利得とコスト関数について,ミクロ経済学の理論をベースにモデル化している点である.
コストと検索行動のモデル化した式であるが,思いっきりコブ=ダグラス生産関数をベースにしている.
コブ=ダグラス生産関数はこちらがわかりやすかったので,以下を参照.
http://www2.toyo.ac.jp/~kawano/lec-semi/mat/mic3.pdf
(1)式では,クエリの数をQ,クエリごとに評価された文書数をAとする.
kは,ユーザが検索システムを使用した際,関連する文書にアクションをどれだけ上手く変換できるかを示している.一言で言うと,どれだけ検索が上手いかである.
bは,クエリと評価の間の相互作用を調整するパラメータ.つまり,どっちに比重を置くか.
元ネタだと,QがK(資本),AがL(労働)である.kがAとなっていて,技術水準を表す.なるほどー!よく情報検索と関係性を見出したなーと思って,ワクワクする.
経済学も物理学のモデルをベースに構築,発展している様子も見受けられるように,物事を抽象化することにより,別の分野へと応用する,本質を見抜き,普遍性を見出していく方々には尊敬の念しかありません.
この(1)式で言いたいことはシンプルで,
・bが減少すると,文書がより意味を持つようになる.つまり,評価プロセスが支配するようになる.
・bが増加すると,多くのクエリを発行し,クエリごとに1つの文書のみを評価する方向になる.
実験は3つのインターフェース,3つのタスクを与えて,36人の学生で被験者内実験を行っている.
後ろから順に,高コストのインターフェース,中コストのベースライン,低コストのクエリ提案のインターフェースとなっている.
結果としては,
青色の四角)高コストインターフェースが有意に全てのインターフェースに対してクエリ数が少ない
オレンジ色の四角)高コストインターフェースが,ベースラインよりも有意に多くの文書を閲覧し,検索結果ページの深いところまでいっている.
高コストインターフェースが全てのインターフェースよりも初回クエリ形成に時間がかかっている.また,検索ページに長く滞在している
議論としては,
基本的に,クエリコストが増加すると,発行されるクエリ数は減少し,評価される文書数が増加するという仮説を支持するものになっている
ただし,予想に反して,ベースラインが最もクエリを発行し,クエリごとに最小の文書閲覧数であり,結果の深度も浅かった.モデルで行くと低コストのインターフェースが該当していたはずである.
著者は,低コストとベースラインのクエリコストが変わらなかったのではないかとしている.
ただ,検索行動は異なるため,今回のモデルでは説明しきれない.
そのため,コスト構造を明らかにする等のモデル改善余地はあると結論づけた.
最後に
本当にざっくりと,論文概要を取り上げた.
夜遅くに本記事を書いているので,いろいろ誤植がありそうと言うのもあり,論文関係は,引き続き投稿していきつつ,間違いがないように,都度都度見直して調整をしていきたい.
この記事が気に入ったらサポートをしてみませんか?