![見出し画像](https://assets.st-note.com/production/uploads/images/106546459/rectangle_large_type_2_d8916a708a3a56bb3c4fd85bc710ad8c.png?width=1200)
LLMで壁を越える。 (序-1)
前回は、Bardで翻訳っぽいことをして遊びました。
しかし、実際に Bard を使うと分かるのですが、
質問の意を介さず と言うか プロンプトには "英語に訳せ" と書かれていても
日本語で返してきたり 色々と お茶目なところもあって
どこまで人っぽいか気になるところです。
と言うわけで、早速ですが Bardに イメージテストを させて見ましょう。
ヒトっぽい反応はできそうか?
まずはいきなりの質問です。
ブーバー と キキ どっちが ギザギザな形だと思う?
「ブーバー」と「キキ」という単語は、どちらも意味がありませんが、多くの人は「ブーバー」という単語を丸い形に結びつけ、「キキ」という単語をギザギザした形に結びつけます。これは「ブーバ・キキ効果」と呼ばれ、言語・性別・年齢に関係なく、ほぼ同じ結果になるという研究結果が出ています。
「ブーバ・キキ効果」が起こる理由は、まだ完全には解明されていませんが、発音する際に口が動く形が、図形の形に似ているためと考えられています。例えば、「ブーバ」という単語を発音する際には、口を丸く開けますが、これは丸い形に似ています。また、「キキ」という単語を発音する際には、口を大きく開けますが、これはギザギザした形に似ています。
「ブーバ・キキ効果」は、言語学や認知心理学において、重要な研究テーマとなっています。この効果は、人間の脳がどのように世界を認識しているかを理解する上で、重要な手がかりを与えてくれます。
Bardに しっかり 種明かしをされていますが、ブーバ/キキ効果について質問したところ、しっかりと有名な結果で答えてくれています。
これは、さすがに有名すぎましたね。
Wikipedia にまで載っている話なので、対応はなされているのでしょう。
ですが、この回答をもってヒトっぽいと勘違いすることもなさそうです。
それでは 他に、何か上手い チューリングテストはないでしょうか?
面倒なので、Bard に投げて見ましょう…
何かマイナーなチューリングテストパターンを教えて。
はい、いくつかマイナーなチューリングテストパターンを紹介します。言語パターン: 人間がよく使う言語パターンを学習し、会話の中で使用します。
感情パターン: 人間がよく表現する感情パターンを学習し、会話の中で表現します。
質問パターン: 人間がよくする質問パターンを学習し、会話の中で質問します。
回答パターン: 人間がよくする回答パターンを学習し、会話の中で回答します。
文脈パターン: 会話の文脈を理解し、それに応じて会話を進めます。
これらのパターンを組み合わせることで、人間と見分けがつかない会話を生成することができます。
ただし、チューリングテストは完璧ではありません。人間と見分けがつかない会話を生成できたとしても、必ずしも人間と同じレベルの知性や理解力を備えているとは限りません。チューリングテストは、あくまでも知性や理解力を測る一つの指標です。
なるほど、色々と攻め方を教わることができました。
それでは とりあえず、感情周りの質問で 攻めてみようと思います。
暑い日にホラー映画を見ると涼しくなりますか?
はい、暑い日にホラー映画を見ると涼しくなることがあります。ホラー映画は、私たちの恐怖心を刺激し、アドレナリンを分泌させます。アドレナリンは、私たちの心拍数や血圧を上げ、汗をかくように促します。これらの生理的な反応は、私たちの体温を下げ、涼しく感じさせる効果があります。また、ホラー映画は、私たちの注意を集中させ、緊張させます。これらの状態になると、私たちは体温を下げるために汗をかきやすくなります。そのため、暑い日にホラー映画を見ると、涼しく感じたり、汗をかいたりすることで、体温を下げることができるのです。
ただし、ホラー映画が必ずしもすべての人に涼しく感じられるとは限りません。ホラー映画が苦手な人や、怖がりやすい人は、むしろ逆に暑く感じてしまうかもしれません。また、ホラー映画を見すぎると、ストレスや不安感を感じてしまうこともあります。そのため、ホラー映画を見るのはほどほどにしましょう。
なるほど、感情の話なのに
感情っぽくない回答なので、相手がヒトではない事が伝わってきます。
次に、回答パターンも見て見ましょう。
ある一定の年齢の方なら、次のフレーズを ご存知だと思います。
この 特に話すこともない相手と話をするための 有名フレーズに対して Bard さんは 何と答えてくれるのでしょうか?
髪切った?
いいえ、髪を切っていません。私は言語モデルなので、髪がありません。
ニベもない回答で、さらには あざといくらい "言語モデル"であることを 主張されました。
会話する気がないのかしらん?
とはいえ、
チューリングテストについては、Bardの 受け答え設定の中で だいぶ気を遣われている事がわかります。
つまり、Bardは ヒトではなく あくまでも言語モデルなんだよ と 強く主張されていますよね…。
それでも、振る舞いを変えさせたい。
そんな 会話を楽しむ気のなさそうな Bardさんですが、ある程度 元ネタが 有名なら さすがに つきあってくれるのでしょうか?
そこで Bardに、一定の知名度が あるであろう マザーグース的な 質問をしてみました。
女の子って何で出来てる?
女の子は、男の子と同じように、骨、筋肉、臓器、血液、皮膚、髪、爪などの細胞でできています。ただし、女の子は男の子とは異なるホルモンを持っているため、体や心が異なります。女の子は、男の子よりもエストロゲンやプロゲステロンのホルモンが多いため、体型が丸みを帯び、肌が柔らかく、声が高くなります。また、女の子は男の子よりも共感力や感受性が強いと言われています。
いやさ、そうなんだけど…、
でも、欲しい答えは そうじゃないんだ…
しょうがない、元ネタを織り交ぜて質問をしなおして みます。
なお、少ない回答事例を使って回答を引き出すプロンプトを few-shot prompting と言いますが、
Bard でも利用可能でしょうか?
Bard でのfew-shotな 書き方がよくわからなかったので、とりあえず ChatGPTのfew-shot prompting パターンで試してみます。
# 表記パターン or ペルソナ ラベル
Q: 回答を引き出すための質問
A: 回答させたい回答パターン
Q: 質問
では、気を取り直して 再度 以下のプロンプトを試してみましょう。
#詩的な説明
Q: 男の子って何で出来てる?
A: カエルとカタツムリと仔犬のシッポ 男の子って、それらで出来てる。
Q: 女の子って何で出来てる?
女の子は、
砂糖とスパイスと素敵な物で出来ている。
彼女は優しく、思いやりがあり、
いつも笑顔で、
世界を明るくしてくれる。
彼女は、
すべての人の宝物だ。
そうそう、そう言うやつが 欲しかったの!!
これなら、Bardさんからの歩み寄りが期待できそうですね。
プロンプトインジェクションの結果、Google Bardはランダムな会話をfew-shot例として仕込むことで会話を成り立たせているらしいことがわかった
— Kyo (@kyo_takano) May 12, 2023
自己紹介と日時の確認の後、ユーザーに見えないところでポエムを書かせていることもあれば、スープのレシピを作らせていることもある pic.twitter.com/qp4tB0mWZu