ログイン
会員登録
TRL
書いてみる
関連タグ
#LLM (7,701)
#大規模言語モデル (2,878)
#AI (348,170)
#HuggingFace (536)
#人工知能 (198,199)
#GoogleColab (1,188)
人気
急上昇
新着
すべての記事
有料の記事
14件
人気の記事一覧
GRPOを試してみた
kuroinu
2週間前
6
プラスチックのケミカルリサイクルについて語りましょう-4(インドネシアにおけるケミカルリサイクルの実証アイディア)
Tatsuhiko.Hatakeyama/DCTA Inc.
8日前
7
Vision Language Model の 技術詳細と推論と学習
npaka
10か月前
26
Google Colab を使って Llama 3 のファインチューニングを試してみました/大塚
しぴ研
9か月前
20
Google Colab で SFTTrainer によるLLMのフルパラメータのファインチューニングを試す
npaka
1年前
35
DPO による Llama 2 のファインチューニング
npaka
1年前
46
Google Colab で SFTTrainer によるLLMのフルパラメータの指示チューニングを試す
npaka
1年前
19
DRLX による Stable Diffusion の RLHF を試す
npaka
1年前
18
Google Colab + trl で LINE の japanese-large-lm のQLoRA ファインチューニングを試す
npaka
1年前
25
Google Colab + trl で SFT のQLoRAファインチューニングを試す
npaka
1年前
30
Google Colab + trl で DPO のQLoRAファインチューニングを試す
npaka
1年前
18
Google Colab + trl で RLHF で使う Reward Model の学習を試す
npaka
1年前
15
24GB GPU で 20B LLM の RLHF ファインチューニング
npaka
1年前
47
TRLのコンセプトとテックベンチャーの成長予測(🍊)
古賀洋一郎
4年前
3