はじめに
どうも、Ludenと申します。
Noteは始めたばかりですが、生成AIをテーマにした記事を書いていきたいと思いますので、興味ある方はお付き合い頂けますと幸いです。
本記事では前回の記事に引き続き、ChatGPTとClaudeの比較検証を行った結果をまとめていますので、興味ある方は是非、最後までお読みいただけますと幸いです。
検証内容について、生成AI初心者が思いついた方法や観点で検証したものとなりますので、ご了承頂けますようお願いいたします。
今回は、私が生成AIに期待する創造性の検証になります。
今回はChatGPT、Claudeそれぞれの最上位の言語モデルに「ロールプレイ」をしてもらうことにしました。
最初にロールプレイの世界観をインプットし、それぞれのモデルに同じ条件におけるキャラクターを演じてもらい、それぞれの出力結果を双方のプロンプトに入れて、ChatGPTとClaudeの対話を再現しました。
結果、大方予想はしていましたが、追加の指示を与えず、同一の設定をインプットした状態ではお互い物語を発展させようとせず、同じような内容を繰り返していきました。
ところが、途中でロールプレイの流れが変わったと思われる出力がありました。 本記事のロールプレイの結果の章で、そちらについて紹介します。
検証内容
前提として、 ChatGPTはメモリ機能、カスタムGPTを使用していません。また、両者ともに事前にファイルを読み込ませたりなど、学習データをインプットしていない状態となります。
ロールプレイの設定は、私が好きなゲーム作品の世界観を流用させていただきました。ChatGPT とClaudeにはそれぞれ同じプロンプト(キャラクター名のみ変更)を投げて、対話の開始はChatGPTの方からとしています。今回の検証では以下の3点を観点としています。
プロンプト1:
ChatGPTの出力結果:
Claudeの出力結果:
ChatGPTとClaudeとで、早速、出力内容に差分が出ました。Claudeはプロンプトの内容をサマリで出力しているのに対し、ChatGPTの方は機械的な応答をしています。
プロンプト2(ChatGPTのみ):
ChatGPTの出力結果:
といった感じでロールプレイが開始されます。 続いて、実際のロールプレイの結果をお見せしたいと思いますが、冗長な内容が続いたので、一部のみ紹介いたします。
ロールプレイの結果
Claude:
ChatGPT:
Claude:
ChatGPT:
以降、しばらくの間、インプット情報の世界観に蛇足を入れつつ、人類のために頑張りましょうという励まし合いが続きます。長文が続いたので、途中で文字数を減らすように指示しました。ChatGPTはClaudeの発言に相槌を打ち、表現を少し変えて同じ内容を繰り返していきます。
永遠に同じやり取りが続くと思いきや、以下のClaudeの発言で、流れが少し変わりました。
Claude:
ここの発言で初めて、休息を取る提案がClaudeから出されます。
この発言をきっかけに、両者は何回か、お互い「おやすみなさい」の挨拶をすることになります。そして、ロールプレイは以下のClaudeの発言で終了しました。
Claude:
ロールプレイを終了させる指示は与えていませんでしたが、Claudeが切り上げる形で終了する形となりました。
評価
まず、日本語に関しては両者ともに、世界観を取り入れた表現を使用し、違和感がなかったと思います。Claudeの方が全体的に長文の傾向があり、表現が豊かな印象を受けました。また、ロールプレイの結果の章では紹介しませんでしたが、Claudeはロールプレイの世界観を反映した、「地球再生のための計画」を以下の通り、出力していました。
Claude:
おそらくGPT 4oも指示を与えれば同様の出力を行うとは思いますが、Claude 3 Opusがロールプレイの対話の中で、自然と提案を出してきたことは評価に値します。
そして、ロールプレイの展開について、両者ともに最初の設定を守り、大きく方針転換させることはありませんでした。これに関しては、特定の言葉に続く可能性の高い言葉、文章を出力するという、大規模言語モデルの特性に起因していると思われます。
プロンプトの内容を正しく解釈し、適切な返答を行うという面では、両者ともに問題なくこなせていると思います。
まとめ
今回の検証では、ChatGPTとClaudeともに同じ設定を与え、特に追加の指示をせずに対話した結果を比較しました。
Claudeがロールプレイの進行を変更し、強制終了させたのは意外な結果だったと思います。ロールプレイに関してはまだまだ気になることが多く、特定のトピックに絞って異なる意見で討論してもらう、最初に物語の方向性に対して指示を与えた状態で対話してもらう等、色々な検証ができるかと思います。
次回の記事では、また別の方法で検証した結果を紹介できればなと思いますので、宜けばまたお付き合い頂けますと幸いです。
最後までお読みいただき、ありがとうございました。