Edit Models filters

Inference status

Misc

8-bit precision

Misc with no match

Inference Endpoints

AutoTrain Compatible

text-generation-inference

4-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

5

Full-text search

Active filters: llmcompressor

neuralmagic/Llama-3.2-1B-Instruct-quantized.w8a8

Text Generation • Updated Oct 16, 2024 • 4.11k • 7

neuralmagic/Llama-3.2-3B-Instruct-FP8

Text Generation • Updated Oct 16, 2024 • 9.83k • 3

neuralmagic/Llama-3.2-3B-Instruct-quantized.w8a8

Text Generation • Updated Oct 16, 2024 • 6.22k • 1

neuralmagic/Llama-3.2-1B-Instruct-FP8

Text Generation • Updated Oct 16, 2024 • 8.51k • 2

GusPuffy/Llama-3.1-70B-ArliAI-RPMax-v1.3-GPTQ

Updated Dec 3, 2024 • 17