ログイン
会員登録
高速推論
書いてみる
関連タグ
#モデル (14,779)
#CS (3,393)
#GQA (1)
#LLM (6,208)
#MMLU (9)
#TriForce (1)
人気
急上昇
新着
定番
有料のみ
2件
人気の記事一覧
TriForce: Lossless Acceleration of Long Sequence Generation with Hierarchical Speculative Decoding
Ikemen Mas Kot
6か月前
3
Dynamic Memory Compression: Retrofitting LLMs for Accelerated Inference
Ikemen Mas Kot
6か月前
1