ログイン
会員登録
報酬モデル
書いてみる
関連タグ
#LLM (7,796)
#AGI (1,152)
#AI (350,057)
#ChainOfThought (35)
#NLP (6,672)
#OpenAI (14,556)
人気
急上昇
新着
すべての記事
有料の記事
6件
人気の記事一覧
OpenAI o1再現モデルまとめ(2024年12月時点)
はち
2か月前
77
OpenAI o1はどう作るのか(詳細編)
はち
5か月前
59
【4コマ】ChatGPTのファインチューニング #260
なごみ@まいにち4コマ
4か月前
12
Reuse Your Rewards: Reward Model Transfer for Zero-Shot Cross-Lingual Alignment
Ikemen Mas Kot
10か月前
1
報酬モデルは因果関係ではなく一貫性を識別する
らみ|AI×心理×ビジネス:エンジニア志望
19時間前
RewardBench: Evaluating Reward Models for Language Modeling
Ikemen Mas Kot
8か月前