neuralmagic
/

Qwen2-1.5B-Instruct-quantized.w8a8

Text Generation

text-generation-inference

Inference Endpoints

8-bit precision

compressed-tensors

Model card Files Files and versions Community

Qwen2-1.5B-Instruct-quantized.w8a8

Commit History

Updated compression_config to quantization_config

28f339d
verified

mgoin commited on Oct 9, 2024

Update README.md

3a444bb
verified

alexmarques commited on Jul 18, 2024

Create README.md

0dd8306
verified

alexmarques commited on Jul 18, 2024

Upload folder using huggingface_hub

31d9b0f
verified

alexmarques commited on Jul 11, 2024

initial commit

8b02ebe
verified

alexmarques commited on Jul 11, 2024