ログイン
会員登録
unsloth
書いてみる
関連タグ
#LLM (7,919)
#AI (352,190)
#grpo (12)
#大規模言語モデル (2,922)
#deepseek (1,968)
#人工知能 (198,520)
人気
急上昇
新着
すべての記事
有料の記事
11件
人気の記事一覧
UnslothのGoogle Colabノートブックで手軽にLLMの蒸留ができる
shi3z
3週間前
183
DeepSeek R1 Dynamic 1.58-bit の概要
npaka
4週間前
93
Unsloth で独自の R1 Reasoningモデルを学習
npaka
2週間前
53
WSL2でunslothのGPROトレーニングを試してみる
noguchi-shoji
2週間前
33
Long-context GRPO
npaka
6日前
20
DPO(選好チューニング)でLLMを訓練する方法
Non
2か月前
11
Unslothで継続事前学習をやってみた
kuroinu
1か月前
1
Unslothで指示チューニング
kuroinu
1か月前
1
Llama3-8Bは日本語データによるfine-tuningでも素晴らしい性能を出しました。 基本性能の高さが大きく貢献しているのでしょう。 日本語のタスクにも十分使える可能性がありそうです!
TOSHI STATS
9か月前
7
UnslothでGRPO
kuroinu
9日前
UnslothでDPOをやってみた
kuroinu
1か月前