人気の記事一覧

色々なライブラリでLLMを量子化してみる

3か月前

LLMモデルのGPTQ量子化でdataloadにはまった

AutoGPTQ と transformers によるLLMの軽量化

1年前

Google Colab で AutoGPTQ + Vicuna-v1.5 を試す

1年前