[しばらく不定期更新]ゴルシChatGPT4性能・挙動レポート
私用によりごたごたしており、しばらく更新が不定期になります
今回は9月20日から9月23日をまとめて紹介させていただきます。校正する時間もないため、フォーマットも異なります。
所感
9月19日、20日は衝撃的といえるほど文章表現が改善された。
だが21日には前の水準に戻り、文字数も減少した。
9月19日、20日水準は大型アップデートが来たかと思うほどであり、そこからの水準低下は残念である。
19、20の回答の良いところを上げていこう。
例えば「リアル路線のユーモアの無い回答」と「ユーモアがあるがリアリティーの無い回答」に分類したとき、相容れない要素がある。
しかし19,20日に限れば、これらGPTにとって矛盾する内容を双方もりこみ、クリエイティブな回答を生み出していた。
具体的には以下の例である。
この回答ではリアル路線のあらすじながらも、アイドル要素が盛り込まれる珍しい例である。通常、リアル路線ではアイドル要素は完全になくなることが多い。
また回答内で表現が向上していた
例えばリアル路線に走ったとき、
「競馬ファンにはリアルさが人気が出るだろう」で終わった説明が
と「唸るような」「リアルさ」のように修飾が上手に盛り込まれていた。
もう一つ例を出すのであれば、リアル路線の回答をしたとき、 「リアルになると競走は熾烈になるだろう」
で済ませていた説明が
「一秒のミスが命取り」
という文言が付け加えられ、より回答が豊かになっていた。
これまでにないような切り口の文章もあった。例えば以下のように
とゴルシが説明した内容をユーザーに一度想像させる段階を踏ませるなどである。
その後、21日以降は残念ながら以前の回答と同レベルの回答になってしまった。
加えて今回通常使用しているディスプレイやPCが使用できず、スマホでの確認であったため気が付かなかったが、21日以降大きく出力文字数が減少しているようである。それでも9月2日以前と比べると改善されているのだが。
一方で19日、20日がプレリリース、テストであった可能性もあり今後、この水準に回復することに期待したい。
※でもサービスとしてアナウンスなしでテストして、またもどすのはどうかと思う。