人気の記事一覧

Vision Language Model の 技術詳細と推論と学習

7か月前

Google Colab を使って Llama 3 のファインチューニングを試してみました/大塚

6か月前

Google Colab で SFTTrainer によるLLMのフルパラメータのファインチューニングを試す

1年前

DPO による Llama 2 のファインチューニング

1年前

Google Colab で SFTTrainer によるLLMのフルパラメータの指示チューニングを試す

1年前

DRLX による Stable Diffusion の RLHF を試す

1年前

Google Colab + trl で LINE の japanese-large-lm のQLoRA ファインチューニングを試す

1年前

Google Colab + trl で SFT のQLoRAファインチューニングを試す

1年前

Google Colab + trl で RLHF で使う Reward Model の学習を試す

1年前

24GB GPU で 20B LLM の RLHF ファインチューニング

1年前

Google Colab + trl で DPO のQLoRAファインチューニングを試す

1年前

TRLのコンセプトとテックベンチャーの成長予測(🍊)