Spaces:

jonaschua
/

llamavision

Runtime error

jonaschua commited on Mar 12

Commit

402ce74

verified ·

1 Parent(s): 4ce392f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -80,40 +80,37 @@ def choose_model(model_name):
 @spaces.GPU(duration=duration)
 def respond(message, history: list[tuple[str, str]], model, system_message, max_tokens, temperature, top_p):
-    print(model)
-    model_name = choose_model(model)
-    client = InferenceClient(model_name, provider=provider, token=os.getenv('deepseekv2'))
-    messages = [{"role": "system", "content": system_message}]
-    for val in history:
-        if val[0]:
-            messages.append({"role": "user", "content": val[0]})
-        if val[1]:
-            messages.append({"role": "assistant", "content": val[1]})
-    messages.append({"role": "user", "content": message})
-    response = ""
-    for message in client.chat_completion(messages, max_tokens=max_tokens, stream=True, temperature=temperature, top_p=top_p):
-        token = message.choices[0].delta.content
-        response += token
-        yield response
 demo = gr.ChatInterface(
-    if mode=="text-to-text":
-        respond,
-        multimodal=False,
-    else:
-        respond,
-        multimodal=True,
     stop_btn = "Stop generation",
     # multimodal = True,
     title="Ask me anything",

 @spaces.GPU(duration=duration)
 def respond(message, history: list[tuple[str, str]], model, system_message, max_tokens, temperature, top_p):
+    if mode=="text-to-text":
+        print(model)
+        model_name = choose_model(model)
+        client = InferenceClient(model_name, provider=provider, token=os.getenv('deepseekv2'))
+        messages = [{"role": "system", "content": system_message}]
+        for val in history:
+            if val[0]:
+                messages.append({"role": "user", "content": val[0]})
+            if val[1]:
+                messages.append({"role": "assistant", "content": val[1]})
+        messages.append({"role": "user", "content": message})
+        response = ""
+        for message in client.chat_completion(messages, max_tokens=max_tokens, stream=True, temperature=temperature, top_p=top_p):
+            token = message.choices[0].delta.content
+            response += token
+            yield response
 demo = gr.ChatInterface(
+    respond,
+    multimodal=True,
     stop_btn = "Stop generation",
     # multimodal = True,
     title="Ask me anything",