人気の記事一覧

UnslothのGoogle Colabノートブックで手軽にLLMの蒸留ができる

3週間前

DeepSeek R1 Dynamic 1.58-bit の概要

4週間前

Unsloth で独自の R1 Reasoningモデルを学習

2週間前

WSL2でunslothのGPROトレーニングを試してみる

2週間前

Long-context GRPO

6日前

DPO(選好チューニング)でLLMを訓練する方法

2か月前

Unslothで継続事前学習をやってみた

1か月前

Unslothで指示チューニング

1か月前

Llama3-8Bは日本語データによるfine-tuningでも素晴らしい性能を出しました。 基本性能の高さが大きく貢献しているのでしょう。 日本語のタスクにも十分使える可能性がありそうです!

9か月前

UnslothでGRPO

9日前

UnslothでDPOをやってみた

1か月前