ISTA-DASLab
/

Meta-Llama-3-8B-AQLM-2Bit-1x16

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Meta-Llama-3-8B-AQLM-2Bit-1x16

1 contributor

History: 4 commits

SpiridonSunRotator's picture

SpiridonSunRotator

Uploaded improved version of quantized model

e7dfbbd verified 10 months ago

.gitattributes

1.52 kB

initial commit 10 months ago
README.md

685 Bytes

Added evaluation results 10 months ago
config.json

4.34 kB

Uploaded improved version of quantized model 10 months ago
generation_config.json

126 Bytes

Uploaded Meta-Llama-3-8B with AQLM 1x16 quantization 10 months ago
model.safetensors

4.08 GB
LFS

Uploaded improved version of quantized model 10 months ago
special_tokens_map.json

73 Bytes

Uploaded Meta-Llama-3-8B with AQLM 1x16 quantization 10 months ago
tokenizer.json

9.08 MB

Uploaded Meta-Llama-3-8B with AQLM 1x16 quantization 10 months ago
tokenizer_config.json

50.6 kB

Uploaded Meta-Llama-3-8B with AQLM 1x16 quantization 10 months ago