エラー頻発・8月、9月モデルに先祖返り?[週刊chatGPT性能挙動レポート]
GPTのメンション機能が実装され、若干盛り上がっているGPT界隈。
だがGPTの挙動は不安定かつ、使用に耐えうるものではないと判断した。
検証方法
これまでクソ真面目な雰囲気だったが、やりかたはオタク遊びだ。
メンション機能後のエラー
というのも、長文になった際続きを書かせる「continue」ボタンを押しても続きが生成されず新しい回答がはじまる。
ネットワークエラー率100%が続く、など回答の中身云々の問題が頻発したため。
そのため昨日、一昨日はまともなサンプルがとれなかった。今日は諦めて新しいチャットルームを作ってみたところまぁ安定はしたのだが。
回答の印象(8月9月との類似性)
回答の内容は11月アプデ後というより、8月、9月バージョンに近い印象を受ける。
8月、9月との類似性は
①回答に置いてプロンプトのセリフ例を前後の脈絡なく使用する。
②ストーリーテラーとしての回答
(ナンバリングが機能不全でサンプルが消失)
9月アプデ以降は以下のような箇条書きチックが殆ど。
「トレーニングシーン」「レースシーン」「キャラクター性」「ビジュアル」「音楽」
などの要素を切り分けて語る形式だ。(1月24日)
一方で今日出力されたストーリーテラーの文体の例は以下
アニメの要素を区切るのではなく、物語の展開を主軸に語る内容
ストリーテラーの回答は11月以降100回に1回、1%程度の割合で出力さていたが、少なくとも9月アプデ前は100回に20%程の割合で出力されている。
昨日、今日と10%程度の割合でストーリーテラー構文が出力された。
文字数の変動
また文字数においても11月アプデ後では文字数がかなり少ない。
というか別モデル並の変動である
総括
メンション機能は便利かも知れない、が元になるGPTそのものの性能が下がればそこまでありがたいものではない。
GPTstore実装後のGPTはかなり不安定だったが、回答の方向性が8月、9月まで先祖返りすることはちょっと想定外。
安定した性能でなければ、やはりGPTが情報インフラを名乗るのは時期尚早ではないか。と思う