neuralmagic
/

Sparse-Llama-3.1-8B-gsm8k-2of4-quantized.w4a16

Text Generation

compressed-tensors

Model card Files Files and versions Community

Sparse-Llama-3.1-8B-gsm8k-2of4-quantized.w4a16

2 contributors

History: 5 commits

nm-research's picture

Update README.md

39413ed verified 5 days ago