neuralmagic
/

OpenHermes-2.5-Mistral-7B-marlin

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

OpenHermes-2.5-Mistral-7B-marlin

1 contributor

History: 4 commits

robertgshaw2's picture

Create quantization/apply_gptq_save_marlin.py

f57a0ec verified 10 months ago