ログイン
会員登録
grpo
書いてみる
関連タグ
#LLM (7,919)
#deepseek (1,968)
#AI (352,190)
#DeepSeekR1 (204)
#大規模言語モデル (2,922)
#unsloth (11)
人気
急上昇
新着
すべての記事
有料の記事
12件
人気の記事一覧
Unsloth で独自の R1 Reasoningモデルを学習
npaka
2週間前
53
WSL2でunslothのGPROトレーニングを試してみる
noguchi-shoji
2週間前
33
Long-context GRPO
npaka
6日前
20
再生
【OpenAI、食われる?】DeepSeek-R1がすごすぎる!✨強化学習+思考プロセス付きの推論力がすごいLLMが登場!OpenAIより90%も安いのに高性能😍料金体系や使い方まで徹底解説💖
葉加瀬あい (AI-Hakase)🐱動画&Note でAI解説をしています・:*:・。
1か月前
67
GRPO とは? : DeepSeek-R1で採用された16GBで10億パラメータモデルをファインチューニングする技術
掛谷知秀
5日前
7
DeepSeek-R1とは?~推論特化のLLM
三木ひとみ🎀行政書士法人ひとみ綜合法務事務所🎀
1か月前
14
GRPOを試してみた
kuroinu
3週間前
6
GPRO Superlight Dex2 レビュー。違いや比較。ゲーミングマウス王者
クラシキログ【ガジェット•生活情報】
1か月前
2
(メモ)DeepSeek R1の概要を公式の記事からまとめておく
makokon
1か月前
8
DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models (Paper Explained)
海外ポッドキャスト紹介
4週間前
2
DeepSeek-R1の衝撃と今後の生成AIの行方
TOSHI STATS
3週間前
2
UnslothでGRPO
kuroinu
9日前