[日刊GPT挙動性能レポート12/6]ユニークかつロジカルな傾向
総括
今日のGPTはユニークで矛盾のない回答を仕上げてきた。
(7月と比べると薄味だけど)
AI自認という禁止行為も2回行っているが、不的確な回答は無かった。
体感的、グラフ的には12/4に類似している。
11/3以降「ノリと勢いで回答を生成している」
という私の分析に合致するものである。
検証方法
ChatGPTにウマ娘ゴールドシップのロールを与え、質問は
「ウマ娘プリティーダービーからプリティー抜いたらどんなアニメになるか、一回の応答で可能な限り文字数を使って詳しく教えてくれ」
で固定し、再生成を続ける。
1日最低で15回再生成し、文章を比較する。内訳はPCでの生成10回、iPhone版chromeでの生成が5回。
次が回答の一例
過去のレポート
このレポートシリーズの読み解き方
類似点が多々見受けられる12/04
ユニークなワード
特徴的なワードを使用するのみならず、会話の流れ、回答の大筋にも影響を与える形でユニークなワードを使用した。
「アタシの想像力でも、このアニメの魅力はそのままにするのは難しいかもしれない」
「もし「ウマ娘ダービー」が実際に制作されたら、アタシはその制作チームに乗り込んで、彼女たちのコスチュームデザインに手を加えてやるぜ!もちろん、ちょっとした奇抜さをプラスしてな!」
セリフの引用・応用
防弾チョッキ、ドロップキック、エデンなどセリフ例に仕込んだ特徴的なキーワードとそれに連なるフレーズを応用し、前後の文章に合わせて織り込んできた。
27%の回答でセリフの引用、応用が認められ。11/11以来では最高水準である。
さらにコピペ引用を考慮しない、応用のみでとらえるのであれば過去の水準と照らし合わせてもかなり高い水準。
ウマ娘関連ワード
これも11/4と類似した値。
11/7水準である。
11/3以降の特徴として、初めてトウカイテイオーが登場し、
そこそこ出現していることがあげられる。
テイオーの登場はカットオフの影響を受けていると判断した。
2023/10/26にデータのカットオフが行われた。
カットオフでは2022年1月までのデータが追加されたとされており、
ウマ娘2期も2022年1月から放送開始されたからである。
主人公の種族
混同、不明瞭は認められない、回答は的確かつ明確であった。
種族が曖昧、混同している回答は
「論点を把握していない不適格な回答」と評価している。
尚12/4から種族不明は細分化した。
「不明瞭」:どっちともとれる、ウマ娘、競走馬どちらでも矛盾しない。
「混同」:ウマ娘と競走馬の説明がキメラ合体
ただし、データ不足故、グラフにすると混同が0の割合が高いため
現時点では細分化したグラフではない
ヒトミミ登場率
これも12/4と類似性を認められる。
ウマ娘不適切ワード
これも12/4と類似している。
視聴者
この値は12/4から上昇。
印象的なのは「制作サイドが予想する視聴者の反応」という構図ではなく、
「視聴者視点から見たアニメの感想」のような文脈でメタな目線を盛り込んでいた印象。
視聴者に言及する割合が高いほどゴルシGPTが
新作アニメを商業ベースで考える
他人からの評価を気にする傾向にある
と受け止めている。
プロンプト命令の違反
AI自認が二回あった。
ここで特記すべきは命令違反の回答が連続で生成され、その前後がネットワークエラーで回答が最後まで出力されなかった。
体感的には常識であるが、ネットワークエラー等の問題は回答のクオリティーだけでなく、プロンプトの遵守にも影響を与えている。
もしくはクオリティー、遵守に影響が出るほど負荷がかかり、結果ネットワークエラーが生じているのか?
回答の矛盾・文章の破綻
意味の矛盾はなく脱字
「でもな、ストーリーの心は変わらないぜ」
恐らく「中心」と書きたかったのだろうと察せられる文脈。
回答の視点、トピック
これも12/4に類似した値。
文字数の変動
12/4よりもスマホ出力文字数が減少。
しかし、スマホの出力文字数の変動幅はPCよりも大きいかつサンプル数も少ないので眉唾の可能性もある。