radarbackend11262024v11

Runtime error

Pijush2023 commited on Sep 14, 2024

Commit

0726e7f

verified ·

1 Parent(s): d118988

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -96,13 +96,21 @@ embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-mpnet-b
 # Initialize the models
 def initialize_phi_model():
     model = AutoModelForCausalLM.from_pretrained(
-        "microsoft/Phi-3.5-mini-instruct",
         device_map="cuda",
         torch_dtype="auto",
         trust_remote_code=True,
     )
-    tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3.5-mini-instruct")
     return pipeline("text-generation", model=model, tokenizer=tokenizer)
 def initialize_gpt_model():
@@ -660,7 +668,7 @@ def generate_answer(message, choice, retrieval_mode, selected_model):
                 response = selected_model(prompt, **{
                     "max_new_tokens": 300,
-                    "return_full_text": True,
                     "temperature": 0.0,
                     "do_sample": False,
                 })

 # Initialize the models
 def initialize_phi_model():
+    # model = AutoModelForCausalLM.from_pretrained(
+    #     "microsoft/Phi-3.5-mini-instruct",
+    #     device_map="cuda",
+    #     torch_dtype="auto",
+    #     trust_remote_code=True,
+    # )
     model = AutoModelForCausalLM.from_pretrained(
+        "microsoft/Phi-3.5-MoE-instruct",
         device_map="cuda",
         torch_dtype="auto",
         trust_remote_code=True,
     )
+    # tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3.5-mini-instruct")
+    tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3.5-MoE-instruct")
     return pipeline("text-generation", model=model, tokenizer=tokenizer)
 def initialize_gpt_model():
                 response = selected_model(prompt, **{
                     "max_new_tokens": 300,
+                    "return_full_text": False,
                     "temperature": 0.0,
                     "do_sample": False,
                 })