「#unsloth」の人気タグ記事一覧｜note ――つくる、つながる、とどける。

UnslothのGoogle Colabノートブックで手軽にLLMの蒸留ができる

3週間前

183

DeepSeek R1 Dynamic 1.58-bit の概要

4週間前

93

Unsloth で独自の R1 Reasoningモデルを学習

2週間前

53

WSL2でunslothのGPROトレーニングを試してみる

2週間前

33

Long-context GRPO

6日前

20

DPO（選好チューニング）でLLMを訓練する方法

2か月前

11

Unslothで継続事前学習をやってみた

1か月前

1

Unslothで指示チューニング

1か月前

1

Llama3-8Bは日本語データによるfine-tuningでも素晴らしい性能を出しました。基本性能の高さが大きく貢献しているのでしょう。日本語のタスクにも十分使える可能性がありそうです!

9か月前

7

UnslothでGRPO

9日前

UnslothでDPOをやってみた

1か月前