neuralmagic
/

Llama-3.2-1B-Instruct-quantized.w8a8

Text Generation

8-bit precision

compressed-tensors

Model card Files Files and versions Community

Llama-3.2-1B-Instruct-quantized.w8a8

Commit History

Update README.md

c1dce56
verified

alexmarques commited on 7 days ago

Updated compression_config to quantization_config

fb30d43
verified

mgoin commited on 14 days ago

Update README.md

012b9c0
verified

alexmarques commited on 27 days ago

Update README.md

e0f0220
verified

alexmarques commited on 27 days ago

Update README.md

0c8a3b8
verified

alexmarques commited on 27 days ago

Update README.md

0f03d3a
verified

alexmarques commited on 27 days ago

Create README.md

111b268
verified

alexmarques commited on 27 days ago

Upload folder using huggingface_hub

7f1db53
verified

alexmarques commited on 28 days ago

initial commit

848afec
verified

alexmarques commited on 28 days ago