人気の記事一覧

DPO(選好チューニング)でLLMを訓練する方法

4週間前

Unslothで指示チューニング

13日前

Llama3-8Bは日本語データによるfine-tuningでも素晴らしい性能を出しました。 基本性能の高さが大きく貢献しているのでしょう。 日本語のタスクにも十分使える可能性がありそうです!

8か月前

UnslothでDPOをやってみた

7日前

Unslothで継続事前学習をやってみた

13日前