neuralmagic
/

DeepSeek-R1-Distill-Qwen-14B-quantized.w4a16

Text Generation

text-generation-inference

Inference Endpoints

compressed-tensors

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-14B-quantized.w4a16

1 contributor

History: 3 commits

nm-research's picture

Upload folder using huggingface_hub

c8e7601 verified 19 days ago

.gitattributes

1.57 kB

Upload folder using huggingface_hub 20 days ago
config.json

16 kB

Upload folder using huggingface_hub 19 days ago
generation_config.json

181 Bytes

Upload folder using huggingface_hub 20 days ago
model-00001-of-00002.safetensors

5 GB
LFS

Upload folder using huggingface_hub 19 days ago
model-00002-of-00002.safetensors

4.93 GB
LFS

Upload folder using huggingface_hub 19 days ago
model.safetensors.index.json

108 kB

Upload folder using huggingface_hub 20 days ago
recipe.yaml

307 Bytes

Upload folder using huggingface_hub 20 days ago
special_tokens_map.json

485 Bytes

Upload folder using huggingface_hub 20 days ago
tokenizer.json

11.4 MB
LFS

Upload folder using huggingface_hub 20 days ago
tokenizer_config.json

6.75 kB

Upload folder using huggingface_hub 20 days ago