Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -47,10 +47,10 @@ from gptqmodel import GPTQModel
 model_name = "ModelCloud/Qwen2.5-Coder-32B-Instruct-gptqmodel-4bit-vortex-v1"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
-model = GPTQModel.from_quantized(model_name)
 messages = [
-    {"role": "system", "content": "You are an AI programming assistant, skilled in analyzing and generating code."},
     {"role": "user", "content": "How can I design a data structure in C++ to store the top 5 largest integer numbers?"},
 ]
 input_tensor = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt")

 model_name = "ModelCloud/Qwen2.5-Coder-32B-Instruct-gptqmodel-4bit-vortex-v1"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = GPTQModel.load(model_name)
 messages = [
+    {"role": "system", "content": "You are Qwen, created by Alibaba Cloud. You are a helpful assistant."},
     {"role": "user", "content": "How can I design a data structure in C++ to store the top 5 largest integer numbers?"},
 ]
 input_tensor = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt")