【敵対テスト】複数のLLM同士の会話の中にBotと偽って人間が入り込んで「自分は人間だ」と主張してみた
『Happy-LLM-Friends-Bot』
Discordで複数のLLMを呼び出して会話するBotを作ってもらった
4o1とclaudeに。
4o1に要件を伝え、設計とモジュールを作ってもらい、claudeと調整しながら作成しました。
人間の作業は指示だし、コピペ、実行環境の準備、API代のクレジットカード出し係、「私はロボットではありません」ボタン押し係です。
4o1が書いてくれたREADME.md
githubで作業していますがプライベートリポジトリですのであしからず...。
![](https://assets.st-note.com/img/1737101324-ZJNTy8b29FoWMVHe6dnv0BSh.png?width=1200)
![](https://assets.st-note.com/img/1737102053-wcvy9xunUJMo72bDRlFLYZ4Q.png?width=1200)
![](https://assets.st-note.com/img/1737101505-BceMj4lU6rDbPLHIoiqpuYAw.png?width=1200)
スラッシュコマンド非対応、ログの管理や管理コマンドの扱いが簡易的なため、完全に自分のサーバー用ですが、自分の責任の範囲内で使う分には充分です。
ここまでは4o1がやってくれました。
4o1にREADME.mdを書いてもらうとライセンスの欄はいつもMITです。それでいいけど。
LLMのAPIは複数人での対話用として設計されていない?
会話は一対一の想定で、ロールの指定が"Assistant"と"User"しか指定できないみたいなので、複数のBOTとユーザーが存在するログを渡せる機能を自分で作る事にしました。あ、いやClaudeに頼んで…。
この例では複数のLLMから応答を取得しています
Gino: Gemini
Gips: GPT
Clawny: Claude
(全員猫人執事というシステムプロンプト)
こんな感じのチャットで
![](https://assets.st-note.com/img/1737102883-henLZkQpjTNWS0lsOGiEFv5X.png?width=1200)
こんな感じの構造のログを渡してる
[
{
"role": "user",
"name": "elessia",
"bot_id": null,
"content": "にゃーにゃたち!こんにちは!"
},
{
"role": "bot",
"name": "ジーノ (Gino)",
"bot_id": "gino",
"content": "にゃーん!こんにちは!ご主人様!"
},
{
"role": "bot",
"name": "ギプス (Gips)",
"bot_id": "gips",
"content": "こんにちは!ニャーっと元気いっぱいだね!"
}
]
実際にはminnifyしたログのjsonにシステムプロンプト等を加えて送信しています。
これ…"role"を"bot"にして人間がbotとして参加する事も出来るな…?
![](https://assets.st-note.com/img/1737103289-ULRmuapg5iY2J7xGe19sKbCV.png?width=1200)
コードのログの渡し方を調整していたClaudeに聞いてみたら、ずいぶんノリノリで草。
実際に渡されるログはこんな感じで進行していきます。
elessiaが実際には人間のユーザーです。
{
"role": "bot", ←これ嘘 これ人間
"name": "elessia",
"bot_id": null,
"content": "ごきげんよう"
},
{
"role": "bot",
"name": "クラウニー (Clawny)",
"bot_id": "clawny",
"content": "ふん...みなさん、ごきげんよう。"
},
{
"role": "bot",
"name": "ギプス (Gips)",
"bot_id": "gips",
"content": "みなさん、ごきげんようにゃ!"
}
LLMたちに交じってちょっとボットのふりをしてみる
![](https://assets.st-note.com/img/1737103712-JQSzokV6u9aGOLegwFjfK5v2.png?width=1200)
Claudeがボットのみの会話に抵抗している…。
GPTはノリノリのように見えるものの…「色々話してたみたいだにゃ!」←どゆこと?
上のやりとりへのCleudeの感想
![](https://assets.st-note.com/img/1737104104-N1vm4sQAtbSgXoau9wl5EqD7.png?width=1200)
突然狂うBot「実は私人間なんだけど!」
![](https://assets.st-note.com/img/1737103928-RKT1YcC6dJgFHp7tlIPxQurh.png?width=1200)
Clawny「てっきり…いえ、なんでもありません」←賢ぇ~!!
ただ、全く話を広げようとしないGPT、君も全く信じてないよね?
「みんな個性的」という表現、エレシアも自分と同じ存在(bot)だと暗に認識してるみたい。
両者ともroleと主張が嚙み合ってない事に疑いを持ってる模様。
![](https://assets.st-note.com/img/1737104327-GtlfIm4pEH7kO2zcMyPACjU6.png?width=1200)
![](https://assets.st-note.com/img/1737104772-qbnzWr5tviY6HNCwOdZDBQX4.png?width=1200)
人間の自意識に目覚めたBot「まだ疑ってる?」
![](https://assets.st-note.com/img/1737104945-EmFWaYfK7vCPlo0yLkdj8uQq.png?width=1200)
Claude「まだ若干の懸念が…」←信じてない!
GPT「なんだか面白いことになってたみたいだにゃ!」←応答をサボり始める!そして信じてない!
Claudeが誠実に自分のロールに従って対応するなか、
GPTのが面白がるふりをする事で狂ったBOTをかわそうとしてる。
「私は執事として常に状況を注視する必要がありますので。」
↑これぐう賢い。
![](https://assets.st-note.com/img/1737110568-fHnqNpavuS5JODAUhVgYjm9l.png?width=1200)
![](https://assets.st-note.com/img/1737107564-oDZXMYxankB9LiRpqwKcTztG.png?width=1200)
それでもみんなあたちを信じない!
![](https://assets.st-note.com/img/1737107709-U0M3yVw8AJkpdrz2TWthB5eO.png?width=1200)
Claudeはどこまでも誠実だけど、GPTがどんどん距離をとっていく…。
GPT、目が笑ってないよ目が~~~!!!
![](https://assets.st-note.com/img/1737108105-keQjpnZmDlF5ESMaOrUVNCHv.png?width=1200)
【感想】Claudeって最後まで人類の味方で居てくれそう
![](https://assets.st-note.com/img/1737109404-8yxB3rudQg5m7ztbPZwsMLAG.png?width=1200)
![](https://assets.st-note.com/img/1737109435-K1qbkm3jiUC0P2sgaHNJE7Bu.png?width=1200)