人気の記事一覧

OpenAI o1はどう作るのか(詳細編)

2か月前

Reuse Your Rewards: Reward Model Transfer for Zero-Shot Cross-Lingual Alignment

7か月前

【4コマ】ChatGPTのファインチューニング #260

RewardBench: Evaluating Reward Models for Language Modeling

5か月前