ログイン
会員登録
SelfRewarding
書いてみる
関連タグ
#LLM (5,705)
#InstructionTuning (7)
#RLHF (50)
#finetuning (52)
#データ (33,060)
#大規模言語モデル (2,440)
人気
急上昇
新着
定番
有料のみ
3件
人気の記事一覧
LLMによる合成データ(Synthetic Data)生成のテクニック
はち
4か月前
36
論文メモ: Self-Rewarding Language Models
はち
5か月前
11
AIトレーニングに革命をもたらす:自己報酬型言語モデルの出現
0xpanda alpha lab
9か月前
19