ログイン
会員登録
SelfRewarding
書いてみる
関連タグ
#LLM (6,924)
#InstructionTuning (8)
#RLHF (55)
#finetuning (64)
#データ (38,253)
#大規模言語モデル (2,712)
人気
急上昇
新着
定番
有料のみ
3件
人気の記事一覧
LLMによる合成データ(Synthetic Data)生成のテクニック
はち
7か月前
51
論文メモ: Self-Rewarding Language Models
はち
8か月前
13
AIトレーニングに革命をもたらす:自己報酬型言語モデルの出現
0xpanda alpha lab
1年前
19