kaist-ai
/

mistral-orpo-alpha

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

JW17 commited on Mar 12, 2024

Commit

d2f8801

·

verified ·

1 Parent(s): 64e37fe

Update README.md

Files changed (1) hide show

README.md +29 -5

README.md CHANGED Viewed

@@ -53,10 +53,34 @@ model-index:
 |Llama-2-Chat |7B|RLHF|6.27|71.37|4.96|
 |Llama-2-Chat |13B|RLHF|6.65|81.09|7.70|
-## Chat Template
-```
-<|user|>
-Hi! How are you doing?</s>
-<|assistant|>
 ```

 |Llama-2-Chat |7B|RLHF|6.27|71.37|4.96|
 |Llama-2-Chat |13B|RLHF|6.65|81.09|7.70|
+## MT-Bench
+![image/png](https://cdn-uploads.huggingface.co/production/uploads/6415c043486c7c9a5d151583/zZvNuUFVLp6jeSvYIbdDN.png)
+## Inference
+```python
+from transformers import AutoModelForCausalLM, AutoTokenizer
+model = AutoModelForCausalLM.from_pretrained("kaist-ai/mistral-orpo-alpha")
+tokenizer = AutoTokenizer.from_pretrained("kaist-ai/mistral-orpo-alpha")
+# Apply chat template
+query = [{'role': 'user', 'content': 'Hi! How are you doing?'}]
+prompt = tokenizer.apply_chat_template(query, tokenize=False, add_generation_prompt=True)
+inputs = tokenizer(prompt, return_tensors='pt')
+# Generation with specific configurations
+output = model.generate(
+  **inputs,
+  max_new_tokens=128,
+  do_sample=True,
+  temperature=0.7
+)
+response = tokenizer.batch_decode(output)
+#<|user|>
+#Hi! How are you doing?</s>
+#<|assistant|>
+#I'm doing well, thank you! How are you?</s>
 ```