ログイン
会員登録
unsloth
書いてみる
関連タグ
#LLM (7,092)
#CPT (90)
#DPO (14)
#Llama3 (190)
#Llama3_2 (20)
#RLHF (56)
人気
急上昇
新着
定番
有料のみ
5件
人気の記事一覧
DPO(選好チューニング)でLLMを訓練する方法
Non
4週間前
11
Unslothで指示チューニング
kuroinu
13日前
1
Llama3-8Bは日本語データによるfine-tuningでも素晴らしい性能を出しました。 基本性能の高さが大きく貢献しているのでしょう。 日本語のタスクにも十分使える可能性がありそうです!
TOSHI STATS
8か月前
7
UnslothでDPOをやってみた
kuroinu
7日前
Unslothで継続事前学習をやってみた
kuroinu
13日前
1