人間のフィードバック

書いてみる

人気の記事一覧

Back to Basics: Revisiting REINFORCE Style Optimization for Learning from Human Feedback in LLMs

8か月前

Reuse Your Rewards: Reward Model Transfer for Zero-Shot Cross-Lingual Alignment

9か月前

Constitutional AI: Harmlessness from AI Feedback

8か月前