abacaj
/

starcoderbase-1b-sft

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

abacaj commited on Sep 6, 2023

Commit

1802ca0

·

1 Parent(s): 0200589

Update README.md

Files changed (1) hide show

README.md +47 -0

README.md CHANGED Viewed

@@ -28,6 +28,53 @@ language:
 - en
 ---
 Evals:
 ![image/png](https://cdn-uploads.huggingface.co/production/uploads/62ceeb27e7f6014c0e9d9268/_i-IkouWb1qMz8c9LXB7M.png)

 - en
 ---
+How to run inference:
+```python
+import transformers
+import torch
+def fmt_prompt(prompt: str) -> str:
+    return f"""[Instructions]:\n{prompt}\n\n[Response]:"""
+if __name__ == "__main__":
+    model_name = "abacaj/starcoderbase-1b-sft"
+    tokenizer = transformers.AutoTokenizer.from_pretrained(model_name)
+    model = (
+        transformers.AutoModelForCausalLM.from_pretrained(
+            model_name,
+        )
+        .to("cuda:0")
+        .eval()
+    )
+    prompt = "Write a python function to sort the following array in ascending order, don't use any built in sorting methods: [9,2,8,1,5]"
+    prompt_input = fmt_prompt(prompt)
+    inputs = tokenizer(prompt_input, return_tensors="pt").to(model.device)
+    input_ids_cutoff = inputs.input_ids.size(dim=1)
+    with torch.no_grad():
+        generated_ids = model.generate(
+            **inputs,
+            use_cache=True,
+            max_new_tokens=512,
+            temperature=0.2,
+            top_p=0.95,
+            do_sample=True,
+            eos_token_id=tokenizer.eos_token_id,
+            pad_token_id=tokenizer.pad_token_id,
+        )
+    completion = tokenizer.decode(
+        generated_ids[0][input_ids_cutoff:],
+        skip_special_tokens=True,
+    )
+    print(completion)
+```
 Evals:
 ![image/png](https://cdn-uploads.huggingface.co/production/uploads/62ceeb27e7f6014c0e9d9268/_i-IkouWb1qMz8c9LXB7M.png)