ログイン
会員登録
報酬モデル
書いてみる
関連タグ
#データセット (883)
#強化学習 (732)
#4コマ漫画 (57,954)
#AGI (781)
#AI (319,859)
#ChainOfThought (9)
人気
急上昇
新着
定番
有料のみ
4件
人気の記事一覧
OpenAI o1はどう作るのか(詳細編)
はち
2か月前
53
Reuse Your Rewards: Reward Model Transfer for Zero-Shot Cross-Lingual Alignment
Ikemen Mas Kot
7か月前
1
【4コマ】ChatGPTのファインチューニング #260
なごみ@まいにち4コマ
1か月前
12
RewardBench: Evaluating Reward Models for Language Modeling
Ikemen Mas Kot
5か月前