はじめに
どうも、Ludensと申します。
今回は前回の記事の続きとなります。
前回はChatGPTによるMBTI診断の結果を紹介しましたが、今回はClaude 3.5 Sonnetと3 Opusの出力結果の紹介になります。
Claude 3.5 Sonnet
出力1:16性格の説明
出力2:質問文の出力
出力3:診断結果の出力
評価:診断結果
性格の種類、質問ともに適切な出力をすることができました。
ただし、同じ診断結果になるように回答を行ったのですが、一部ChatGPTとは異なる判定となりました。
知覚 (P)は質問の少なさから難しいところですが、外向性 (E)に関しては、回答内容に対して不適切ではないかと思います。なぜこのような診断結果となったのか、3.5 Sonnetの判定根拠について聞いてみます。
プロンプト:
出力4:
評価:診断根拠
なるほど、質問量が十分ではなく、AIも判定に迷っていたようです。確かに、10個の質問で、5段階の選択肢という診断では、十分な精度が得られないのはその通りです。
知覚(P)に関する判定は納得できました。どうやら、私の回答が矛盾しているということでした。質問4と9の内容は仕事の時を意識して回答し、質問10は私生活における観点から回答してしまったのかもしれません。この質問の中ではP寄りという判定結果となったようですね。知覚(P)の判定結果はこれで妥当かと思います。
しかし、外向性(E)はやや不適切だと思います。
・「新しい人々と出会うのが好きで、社交的な場面でエネルギーを得る」
→そうではない
・「グループでの活動よりも、一人で過ごす時間の方が好き」
→その通り
これらは内向性が強いことを示していると思うのですが、3.5 Sonnetは総合的に外交的であると判定したようです。
回答の賛成・否定の強度が5段階しかないこと、質問数が少ないことから、このような判定になっても仕方のないことだと思います。
因みに、質問1と質問7をそれぞれ5(最も否定)と1(最も賛成)という極端な回答にしたところ、内向性(I)と判定されましたので、やはり判断基準が曖昧だったのかもしれません。
Claude 3 Opus
出力1:16性格の説明
出力2:質問文の出力
出力3:診断結果の出力
評価:診断結果
ChatGPT、3.5 Sonnetと比べてコンパクトな診断結果が出力されました。質問文の出力において、選択肢の内容を並べているのは非常に良い配慮だと思います。しかし、3.5 Sonnetと同様、外向性(E)と内向性(I)の判定がChatGPTの結果と異なります。外交性と内向性の判定結果の根拠について聞いてみます。
プロンプト:
出力4:
評価:診断根拠
新しい環境への適応が得意が外交的な傾向と判断されるのは意外でした。 私自身、仕事や私生活の両方、同じことをやり続けるのがあまり好きでなく、変化があったほうが楽しいと思うのですが、外交的な傾向になるのでしょうか。
また、人との交流に関連する質問ではいずれも1人であることを好む回答をしているのですが、新しい環境への適応に対する回答が最優先されて外交的と判定されたのは少し違和感があります。これも判定基準、質問量の少なさによる精度の低下なのかもしれません。
まとめ
ChatGPT、Claudeともに、性格診断を問題なく行うことができたと証明されました。質問と回答の選択肢を増やすことで、より正確な診断結果が得られると思います。
普段当たり前のように使っている生成AIですが、どこまでが限界なのかを追求したくなります。
またネタを思いついたら記事にして投稿したいと思いますので、その際はお付き合い頂けますと幸いです。
最後までお読みいただきありがとうございました。
それではまた次の記事で!