Spaces:

AstroMLab
/

AstroSage-8B

Running on Zero

Tijmen2 commited on Nov 15, 2024

Commit

4775357

verified ·

1 Parent(s): c94cc88

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -11,6 +11,7 @@ llm = Llama(
     model_path=model_path,
     n_ctx=2048,
     n_threads=4,
     seed=42,
     f16_kv=True,
     logits_all=False,
@@ -27,14 +28,15 @@ def respond(message, history, system_message, max_tokens, temperature, top_p):
             messages.append({"role": "assistant", "content": assistant_msg})
     messages.append({"role": "user", "content": message})
-    response = llm.generate_chat(
-        messages,
         max_tokens=max_tokens,
         temperature=temperature,
         top_p=top_p
     )
-    return response
 demo = gr.ChatInterface(
     respond,
@@ -46,6 +48,5 @@ demo = gr.ChatInterface(
     ]
 )
 if __name__ == "__main__":
     demo.launch()

     model_path=model_path,
     n_ctx=2048,
     n_threads=4,
+    chat_format="llama-2",
     seed=42,
     f16_kv=True,
     logits_all=False,
             messages.append({"role": "assistant", "content": assistant_msg})
     messages.append({"role": "user", "content": message})
+    response = llm.create_chat_completion(
+        messages=messages,
         max_tokens=max_tokens,
         temperature=temperature,
         top_p=top_p
     )
+    # Extract the assistant's message from the response
+    return response["choices"][0]["message"]["content"]
 demo = gr.ChatInterface(
     respond,
     ]
 )
 if __name__ == "__main__":
     demo.launch()