前回記事で、このnoteから幾つかの記事を選んで、AI(ChatGPT o1)にスコアリング評価をしてもらいました。出てきたスコアがおおむね80点付近に収束しているのがとても気になる。そのあたりをAIに問いただします。
恣意的に80点くらいになるようにしていない?
AIに対する対話は率直かつ簡潔に。「スコアが80点付近に固まっているのが気になるのですが、これは意図的ですか?」とストレートに聞いてみました。以下が回答です。
なるほど。私のプロンプトからイラ立ちを感じ取ったのか(?)、配慮が垣間見られる回答が来ました。そうか、そうなのか。と納得するにはまだ早いですよね。
スコアリングの計算式を出せる?
そこまで立派な事を言うのであれば、計算式をきちんと出してもらいましょう。「スコアリングの計算式は出せますか。」
おお、計算式が出てきましたね!そうか、きちんと裏付けがあったわけですね。疑って申し訳なかった。
でも、「おやっ」と思うことも一つ
最後に、きちんと検証をするために、「それぞれの記事に対するスコアリングと結び付けて、数式化してください。」とお願いします。ここで違和感が発生・・・
どうやら、元々出してきたスコアと、計算式にあてはめたスコアの間に乖離が出たようで、※のあとに言い訳コメントが付いてきました・・・
まとめ
この一件をもって、AIに対してどうこうと言う事もないと思いますが、私の中での推察は以下の通りです:
記事をスコアリングして欲しい、という依頼に対して、AI側としては何らかの推論をもって点数をつけてみた。一方で、その際には何か明確な計算式は存在せず、「80点付近で出しておくか」という背景もあった可能性は否定できない。
そのうち、80点付近に収束していることの疑念や、計算式を求めてくる依頼に対して、これまで出したスコアと一致するような計算式を、そのときに改めて創り出した。
まず、スコアありきの状態で、そのスコアに対してあてはまる計算式を出した結果、スコアに若干の乖離がある記事が出てきてしまった。
なるほど、この推察に正しいところがあるとすれば、AIに何か評価めいたことを依頼する際には、根拠となる計算式も一緒に求めておかないと、AIなりの「微調整」や「気配り」に振り回されることになってしまいます。
「ChatGPT の回答は必ずしも正しいとは限りません。重要な情報は確認するようにしてください。」とChatGPTの動作上も明記されていますが、その理由の一端を覗けたような気もしました。
他の記事はこちらのリンクから: