Spaces:

AuriLab
/

gpt-bi-instruct

Sleeping

App Files Files Community

ZeusCabanas commited on Mar 1

Commit

939a60b

1 Parent(s): 1d90bff

arreglos 5

Browse files

Files changed (1) hide show

app.py +18 -19

app.py CHANGED Viewed

@@ -1,50 +1,49 @@
 import gradio as gr
 from huggingface_hub import InferenceClient
-"""
-For more information on `huggingface_hub` Inference API support, please check the docs: https://huggingface.co/docs/huggingface_hub/v0.22.2/en/guides/inference
-"""
 client = InferenceClient("AuriLab/gpt-bi-instruct-cesar")
-def respond(
-    message,
-    history: list[tuple[str, str]],
-):
     messages = [{"role": "system", "content": "Gpt-Bi zara, AuriLabsek sortutako assitente digitala."}]
     for val in history:
         if val[0]:
             messages.append({"role": "user", "content": val[0]})
         if val[1]:
             messages.append({"role": "assistant", "content": val[1]})
     messages.append({"role": "user", "content": message})
     response = ""
-    for message in client.chat_completion(
         messages,
-        max_tokens=60,
         stream=True,
         temperature=0.7,
         presence_penalty=1.5,
         top_p=0.85,
     ):
-        token = message.choices[0].delta.content
         response += token
-        yield response
-"""
-For information on how to customize the ChatInterface, peruse the gradio docs: https://www.gradio.app/docs/chatinterface
-"""
 demo = gr.ChatInterface(
     respond,
     title="Demo GPT-BI Instruct",
 )
 if __name__ == "__main__":
     demo.launch()

 import gradio as gr
 from huggingface_hub import InferenceClient
+# Inicializa el cliente con el modelo deseado
 client = InferenceClient("AuriLab/gpt-bi-instruct-cesar")
+# Define las secuencias de parada que detendrán la generación
+stop_sequences = [".", "?", ".\n", "\n\n"]
+def respond(message, history: list[tuple[str, str]]):
+    # Construir el historial de mensajes para la conversación
     messages = [{"role": "system", "content": "Gpt-Bi zara, AuriLabsek sortutako assitente digitala."}]
     for val in history:
         if val[0]:
             messages.append({"role": "user", "content": val[0]})
         if val[1]:
             messages.append({"role": "assistant", "content": val[1]})
     messages.append({"role": "user", "content": message})
     response = ""
+    # Inicia la generación en modo streaming
+    for token_msg in client.chat_completion(
         messages,
         stream=True,
         temperature=0.7,
         presence_penalty=1.5,
         top_p=0.85,
     ):
+        token = token_msg.choices[0].delta.content
         response += token
+        # Comprueba si la respuesta termina con alguna de las secuencias de parada
+        for stop_seq in stop_sequences:
+            if response.endswith(stop_seq):
+                # Opcionalmente, se puede remover la secuencia de parada final
+                response = response[:-len(stop_seq)]
+                yield response
+                return  # Detener la generación
+        yield response
+# Configuración de la interfaz de chat con Gradio
 demo = gr.ChatInterface(
     respond,
     title="Demo GPT-BI Instruct",
 )
 if __name__ == "__main__":
     demo.launch()