実験:ChatGPTにtwitterと検索ログからユーザープロファイリングの真似事をしてもらう(ChatGPT部, 大城)

こんばんは、ChatGPT部(チャットGPT部)、部長の大城です。
今日は「ChatGPTにユーザープロファイリングはできるのか」という実験を少ししてみます。

結論としては、プロンプトだけでは粗粗なものの、おそらく一定は可能。本格的にやるならやはり機械学習(ただし、未実施)、という感触でした。

行動データによるユーザープロファイリングとは

こちら、アドテク業界などでは結構有名ですが、「Webの行動ログ」や「購買データ」などを利用して、性別年代や趣味嗜好を推定する、ということが可能です(多くの場合は、機械学習モデルを作ります)

イメージとしてはこちら(一昔前の、googleの属性推定の結果ですね。以下は7年くらい前の私のデータを元にしてます)

で、今回はこれを「機械学習なしでChatGPTで実施できるか」という実験になります。

①Twitterデータでチャレンジしてもらう実験

ではさっそく試してみましょう。私のツイートを20件ほど読み込んでもらって推定してもらいましょう。環境はChatGPT-4にbingのWebブラウズ機能をつけて実行してます。

結果


うーん、20件のtweet情報だけだと、可もなく不可もなく、といったところでしょうか。
性別年代は私は基本的には表には出していないので、推定(推測)できてないという結論に。

どういうデータがあれば良いのか、という質問

では属性推定にどのようなデータがあると望ましいか、ということをChatGPTに聞いてみました。まずは確度が高いものはこちら。

購入履歴やウェブサイトのアクセスログは王道ですね。

続いて、もう少し確度低いものにも幅を広げるとこちら。

好みの音楽、とかは確かに世代が分かれそうだなという気もしました。

②Web検索ログ風のデータを与えてみる実験

では先ほどの確度高い、の方にも出ていたWeb検索ログ風のデータ、ということでURLをいくつか用意しました。こちらではどうでしょうか。

結果はこちら。途中、何度か検索に失敗していましたが一旦最後の表だけ記載します。

上記をまとめたユーザープロファイリングはこちら。

年代は20-50代、と幅広ですがあってますね。あとはIT関係者、というのも正解です。(アプリではなくデータ分析系ではありますが。)

ただ、年代がアニメサイコパスだけではわからん、というのでもう少しヒントを与えてみます。

ヒントのURLを付与しての性別推定

以下のサイトの情報を加味するとどうか、という感じで投げています。
(博多の床屋の情報)

なぜか英語で返事をしてきたので、日本語に変換。

名古屋の美容院はよくわからないですが、理容店のため男性の傾向が高い、という回答になりました。


検索ログからのプロファイリング結果

以下、まとめてもらいました。

いかがでしょうか。職業IT関係、地域・日本は正解ですね。あと確度中とありますが男性であること、趣味にテクノロジーがある、なども合ってそうです。一方で台風に関心があるのは出張のため、とまではまだ推測できていないようです。あと年代も不明となっています。

個人的には簡易的なプロファイリングとしては悪くないなと思っていますし、これをどんどん束ねていくと、もっと精度は上がっていくかと思います。

注意事項と所感:あくまで実験、また個人情報には配慮が必要

ちなみに今回は私自身のデータで実験しているので問題はないのですが、実際企業で行う場合はデータの利用規約確認やユーザーからの同意を得る必要があります。特に、個人の特定はしないように気を付けるのも重要です。

また実際はここから応用して、機械学習のモデルを作ったり、アンケートデータを正解データとして入れたり、という工程が発生すると思いますが、「どのような変数を入れたら属性推定に効きそうか」という部分は一定ChatGPTと相談しながらでも進めることができそうだな、と思いました。
(この辺り、多分先日紹介したnoteableプラグイン、とか使うとデータさえ用意すれば全自動でやってくれるかもしれません)

全体的な所感としましては、「データ量が増えればできるけど、まだ人間のカンには及ばない」というところですね。この辺りは今後のChatGPTを始めとした汎用AIの進化次第かなと思っております。

それでは簡単にではありますが、今日はユーザープロファイリングにChatGPTを使う実験でした。それではみなさんもどうぞ良いChatGPTライフを・・!(大城)

この記事が気に入ったらサポートをしてみませんか?