いくらなんでも80は少ない。もう少し書いたはず・・・とポメラを調べるとまだ全然あった。
というわけで、Rachelデータセットを改めてファインチューニングしてみた
今回は、過学習してるポイントを知るため、3エポック、6エポック、9エポックでテスト
3エポック
なんかこれだけでも面白いじゃないの
エポック6
なぜ味噌屋八郎商店を知ってるんだ
富士山の登山ルートは正しく答えられている。電脳空間カウボーイズは教師データにあるのに間違えている。これに対する回答がどうなるかが過学習してるかどうかわかるかもしれない。
エポック9
完全に過学習している
次はエポック6を中心にスイートスポットを探ってみたい
--
追記
エポック4
なんだよ電電虫って
エポック5
いいじゃない。特に「GPTってなに?」に対して「ググれ」と返すのがいい
エポック7
うーん。なかなか味わいがある。
過学習が始まってる感じがする
エポック8
過学習が進んでる感じがする
しかし、よく考えると、どれもそれなりに面白いから
面白い回答を選ぶAIを別に作ってレーティングしたら普通に楽しい会話ロボットになるのではないだろうか