Spaces:

C2MV
/

BioRAG

Sleeping

App Files Files Community

C2MV commited on Oct 5, 2024

Commit

0108ace

verified ·

1 Parent(s): 2118254

Update app.py

Browse files

Files changed (1) hide show

app.py +11 -16

app.py CHANGED Viewed

@@ -1,6 +1,6 @@
 import gradio as gr
 import torch
-from transformers import AutoModelForCausalLM, AutoTokenizer, MarianMTModel, MarianTokenizer
 import time
 from functools import wraps
 import sys
@@ -34,7 +34,7 @@ except ValueError as e:
     sys.exit(1)
 try:
-    model = AutoModelForCausalLM.from_pretrained(
         model_name,
         torch_dtype=torch.float16 if device == "cuda" else torch.float32
     ).to(device)
@@ -65,20 +65,15 @@ def generar_respuesta(consulta):
         # Tokenizar la consulta
         inputs = tokenizer.encode(consulta, return_tensors="pt").to(device)
-        # Configurar los parámetros de generación
-        generation_kwargs = {
-            "max_new_tokens": 100,  # Ajustado a 100
-            "do_sample": False       # No usar sampling
-            # "temperature": 0.6,    # Eliminado para evitar advertencias
-            # "top_p": 0.9            # Eliminado para evitar advertencias
-        }
-        # Generar la respuesta
         with torch.no_grad():
-            outputs = model.generate(input_ids=inputs, **generation_kwargs)
-        # Decodificar la respuesta
-        respuesta = tokenizer.decode(outputs[0], skip_special_tokens=True)
         return respuesta
     except Exception as e:
         print(f"Error durante la generación de respuesta: {e}")
@@ -116,7 +111,7 @@ def procesar_consulta(consulta, idioma):
     return respuesta_original, traduccion
 # Definir la interfaz de Gradio
-titulo = "Generador de Respuestas con SelfBioRAG 7B"
 descripcion = "Ingresa una consulta y selecciona el idioma de salida. El modelo generará una respuesta basada en el contenido proporcionado."
 iface = gr.Interface(
@@ -126,7 +121,7 @@ iface = gr.Interface(
         gr.Dropdown(choices=["Inglés", "Español"], value="Español", label="Idioma de Salida")
     ],
     outputs=[
-        gr.Textbox(label="Respuesta Original (Inglés)"),
         gr.Textbox(label="Traducción al Español")
     ],
     title=titulo,

 import gradio as gr
 import torch
+from transformers import AutoModel, AutoTokenizer, MarianMTModel, MarianTokenizer
 import time
 from functools import wraps
 import sys
     sys.exit(1)
 try:
+    model = AutoModel.from_pretrained(
         model_name,
         torch_dtype=torch.float16 if device == "cuda" else torch.float32
     ).to(device)
         # Tokenizar la consulta
         inputs = tokenizer.encode(consulta, return_tensors="pt").to(device)
+        # Realizar una pasada hacia adelante (forward pass)
         with torch.no_grad():
+            outputs = model(inputs)
+        # Procesar la salida según las capacidades del modelo OmniGenome
+        # Aquí deberás implementar la lógica específica basada en lo que OmniGenome retorna
+        # Por ejemplo, si retorna embeddings, podrías convertirlos a texto de alguna manera
+        # Dado que OmniGenome no está diseñado para generación de texto, este es un placeholder
+        respuesta = "Salida del modelo OmniGenome no está diseñada para generación de texto."
         return respuesta
     except Exception as e:
         print(f"Error durante la generación de respuesta: {e}")
     return respuesta_original, traduccion
 # Definir la interfaz de Gradio
+titulo = "Generador de Respuestas con OmniGenome"
 descripcion = "Ingresa una consulta y selecciona el idioma de salida. El modelo generará una respuesta basada en el contenido proporcionado."
 iface = gr.Interface(
         gr.Dropdown(choices=["Inglés", "Español"], value="Español", label="Idioma de Salida")
     ],
     outputs=[
+        gr.Textbox(label="Respuesta Original"),
         gr.Textbox(label="Traducción al Español")
     ],
     title=titulo,