言語モデル微調整

書いてみる

関連タグ

#AIフィードバック学習 (1)

#LoRAモデル (3)

#スカラー (71)

#スカラー化関数 (1)

#モデル (16,529)

#使用 (4,889)

#多目的強化学習 (1)

人気急上昇新着

1件

人気の記事一覧

Multi-objective Reinforcement learning from AI Feedback

7か月前

noteプレミアム
note pro
よくある質問・noteの使い方
プライバシー
フィードバック
ご利用規約
通常ポイント利用特約
加盟店規約
資⾦決済法に基づく表⽰
特商法表記