ウマ娘ゴールドシップのロールを与えたChatGPTの回答を再生成させ、回答傾向を可能な限り短いスパンでの変化を分析する。
目的
公式アナウンスのない調整やエラーの確認
SNSで…
- 運営しているクリエイター
#AI
ChatGPTの性能わからん
以下はChatGPT性能検証の前提記事です。
昨日から新しいチャットルームを使用したゴルシGPTでの性能検証を始めた。以下は昨日の記事。
性能検証を始めたはいいものの
「ChatGPTわからん」
というお気持ちが強くなってしまった。スマホへの回答文字数がPCへの回答文字数を上回ったのだ。
1075回の出力を行った旧ゴルシGPTではスマホ出力文字数とPC出力文字数は大きな隔たりがあった
[9/10]ChatGPT4挙動レポート
前提
結論
発想、語彙のユニークさ、表現力は9月4日以降の高水準を維持している。
一方でプロンプトで禁じられた箇条書きの多用など、懸念材料が残る。
一部界隈で昨日から出力内容の品質低下が報告されており、関連性がある可能性があるが不明
① プロンプトで禁止した箇条書きの異常な使用(特筆すべき点)
15回の出力中10回が箇条書きを使用されており、偶然と片付けるには多すぎる。プロンプトでは
[9/11]ChatGPT4挙動レポート
結論
プロンプトに違反する箇条書きの多用が機能と同水準。
プロンプト軽視、命令無視であるのでプロンプトへの理解についての挙動が変化した可能性がある。
語彙、表現力は9月4日?のアプデ以降の高水準を保っている。これまであまり使用されてこなかったような単語が表現力を高めている。
今日の回答では口語語彙力が向上しているように見えた。
また、うまぴょい伝説、ルドルフ、オグリ、エルなど関連ワードやウマ娘