TinyLamda
/

llama-3.2-1b-4bit-128g

Text Generation

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

llama-3.2-1b-4bit-128g

1 contributor

History: 4 commits

TinyLamda's picture

AutoGPTQ model for meta-llama/Llama-3.2-1B: 4bits, gr128, desc_act=False

8dc579c verified 5 months ago