DebasishDhal99
/

deepseek-coder-1.3b-base-gptq-4bit

Text Generation

text-generation-inference

4-bit precision

Model card Files Files and versions Community

DebasishDhal99 commited on Mar 1

Commit

3f63576

·

verified ·

1 Parent(s): 4baba4e

Update README.md

Files changed (1) hide show

README.md +22 -2

README.md CHANGED Viewed

@@ -1,16 +1,36 @@
 ---
 library_name: transformers
-tags: []
 ---
 # Model Card for Model ID
 <!-- Provide a quick summary of what the model is/does. -->
 ## Model Details
 ### Model Description
 <!-- Provide a longer summary of what this model is. -->

 ---
 library_name: transformers
+datasets:
+- allenai/c4
+metrics:
+- perplexity
+base_model:
+- deepseek-ai/deepseek-coder-1.3b-base
 ---
 # Model Card for Model ID
 <!-- Provide a quick summary of what the model is/does. -->
+Original Model - https://huggingface.co/deepseek-ai/deepseek-coder-1.3b-base
 ## Model Details
+Hardware - 1 × T4 GPU (Available on Colab)
+Quantized Results
+  - 'perplexity': 34.34962463378906
+  - 'latency (s/sample)': 0.09376240968704223
+  - 'tokens/sec': 1128.3199776234046
+  - 'model size (MB)': 252.19140625
+Base Results
+  - 'perplexity': 32.1390380859375
+  - latency (s/sample)': 0.02939531135559082
+  - tokens/sec': 3599.0093358843974
+  - model size (MB)': 5136.3828125
 ### Model Description
 <!-- Provide a longer summary of what this model is. -->