- 運営しているクリエイター
#AIとやってみた
[日刊GPT挙動性能レポート12/4]回答ロジックに大きな調整入った可能性?
総括 今日は11/7アプデ後の水準で考えるとユニークな回答、表現が目立つ。
ただし、回答の的確さ、論理性は低下しているように感じる。
また弱い根拠ではあるが回答のロジックに大きな変更があった可能性すらあると感じた。
今日の特徴は11/3以降時折みられる「ノリと勢いで回答を生成している」
という私の分析に合致するものである。
(私は11/7アプデの方向性を11/3以降テストしていたと感じて
[日刊GPT挙動性能レポート12/3]昨日の淡泊路線がつづく。不適切な回答の印象が強い
総括 今日は淡泊かつエラーが目立つ傾向であった。
昨日と同じ路線である。
ボキャブラリー、表現は全体的に淡泊
一昨日はボキャブラリーが豊かではないものの、言葉の組み合わせで説明、表現能力が高かった。
この傾向は昨日から弱まったが、その潮流は継続してるように感じる。
ただし、この表現の使い分けは読み手がかなり慎重に読むと気が付く程度。
一昨日ほど明確かつ新鮮に感じるものではない。
ま
[11/29]昨日より視点、トピックを浅く広く触れるchatGPT性能挙動解説
今日は実験的に一部アプリGPTで後述筆記、校正をさせています。
いつもと文体が違うかも。
総括 本日のGPTのパフォーマンスについて、昨日11月28日との比較を行うと、一つの回答に含まれるトピックの多さが際立っていました。
昨日のGPTは、一つの回答で取り上げるトピックが限られており、
かつ類義語や同義語を多用することで、
情報量が極めて少なく感じられました。
しかし、今日のGPTは
[11/13]論理的で目新しさのない回答が続くchatGPT性能挙動レポート
総括 11/7の新バージョンはアナウンスされる前の11/3には投入されていた。
CoTで思考している途中途中の内容を回答に盛り込んでしまい、面白い、バラエティーがあるが、割と滅裂な回答が多い。
11/11からChatGPTの回答が論理的だがバラエティー、新規性が内という傾向を指摘してきた。
グラフ的には今日の回答は9/25モデルの10/20前後から11/2の間に一部類似した傾向が見られるよう
[8/26~10/06]グラフ化ChatGPT性能定性分析
久しぶりにChatGPTの回答を定性分析した。
ここまで間隔があいたのはBingに作らせたマクロを実行したらPCがブルスクになり、電源が入らなくなった「0901事件」(勝手に読んでるだけ)の影響である。
修理に持ち込んだところ、メモリーが破壊されていたようだ。
マクロの負荷でメモリーって壊れるのか?
それはおいておいて、本題の定性分析のグラフを説明と共に列挙しよう。
尚、あまり影響のなさそ
[10/05]ChatGPT考察・同一プロンプト、別チャットルームの差異
ウマ娘3期がドゥラメンテ登場で手のひらぐるぐるする要素はあるけど、アプリが足を引っ張っていて覇権アニメになるにはまだ火力が足りないなと感じる今日。
今日は前から噂されていた、「同じプロンプトでもチャットルームが変わると回答の傾向が変わる」という情報の検証のフェーズに突入した。
突入した、というより突入させられた。
因みにチャットルームとはヘッダーのようにしおり?のように別のチャットという
[09/26]GPTゴルシ挙動性能レポート
所感
全体的にユーモア、ユニークさが強く感じられた。文脈のユニークさが高い水準を維持しており、ところどころ表現力の向上が感じられる回答もあった。
セリフの改変も続いている。
ただし箇条書きの使用回数も6回であった。
ある程度プロンプトから逸脱する調整が入ったおとといからの挙動が維持されており、今日は調整がなかったのだろう。
##①前提
以下のリンクが分析の前提である。
https:/