|
import gradio as gr |
|
import torch |
|
from transformers import AutoModelForCausalLM, AutoTokenizer, MarianMTModel, MarianTokenizer |
|
import time |
|
from functools import wraps |
|
import sys |
|
import spaces |
|
|
|
|
|
def medir_tiempo(func): |
|
@wraps(func) |
|
def wrapper(*args, **kwargs): |
|
inicio = time.time() |
|
resultado = func(*args, **kwargs) |
|
fin = time.time() |
|
tiempo_transcurrido = fin - inicio |
|
print(f"Tiempo de ejecuci贸n de '{func.__name__}': {tiempo_transcurrido:.2f} segundos") |
|
return resultado |
|
return wrapper |
|
|
|
|
|
device = "cuda" if torch.cuda.is_available() else "cpu" |
|
if device == "cpu": |
|
print("Advertencia: CUDA no est谩 disponible. Se usar谩 la CPU, lo que puede ser lento.") |
|
|
|
|
|
model_name = "dmis-lab/selfbiorag_7b" |
|
|
|
try: |
|
print("Cargando el tokenizador y el modelo de generaci贸n desde HuggingFace...") |
|
tokenizer_gen = AutoTokenizer.from_pretrained(model_name) |
|
model_gen = AutoModelForCausalLM.from_pretrained( |
|
model_name, |
|
torch_dtype=torch.float16 if device == "cuda" else torch.float32 |
|
).to(device) |
|
except ValueError as e: |
|
print(f"Error al cargar el tokenizador de generaci贸n: {e}") |
|
sys.exit(1) |
|
except Exception as e: |
|
print(f"Error al cargar el modelo de generaci贸n: {e}") |
|
sys.exit(1) |
|
|
|
|
|
|
|
translation_models = { |
|
"Espa帽ol": "Helsinki-NLP/opus-mt-en-es", |
|
"Portugu茅s": "Helsinki-NLP/opus-mt-en-pt", |
|
"Franc茅s": "Helsinki-NLP/opus-mt-en-fr", |
|
"Alem谩n": "Helsinki-NLP/opus-mt-en-de", |
|
|
|
} |
|
|
|
|
|
tokenizer_trans = {} |
|
model_trans = {} |
|
|
|
for lang, model_name_trans in translation_models.items(): |
|
try: |
|
print(f"Cargando el tokenizador y el modelo de traducci贸n para {lang} desde HuggingFace...") |
|
tokenizer = MarianTokenizer.from_pretrained(model_name_trans) |
|
model = MarianMTModel.from_pretrained(model_name_trans).to(device) |
|
tokenizer_trans[lang] = tokenizer |
|
model_trans[lang] = model |
|
except Exception as e: |
|
print(f"Error al cargar el modelo de traducci贸n para {lang}: {e}") |
|
sys.exit(1) |
|
|
|
@spaces.GPU(duration=120) |
|
@medir_tiempo |
|
def generar_y_traducir_respuesta(consulta, idioma_destino): |
|
""" |
|
Funci贸n que genera una respuesta a partir de una consulta dada y la traduce al idioma seleccionado. |
|
""" |
|
try: |
|
if not consulta.strip(): |
|
return "Por favor, ingresa una consulta v谩lida.", "" |
|
|
|
|
|
inputs = tokenizer_gen.encode(consulta, return_tensors="pt").to(device) |
|
|
|
|
|
generation_kwargs = { |
|
"max_new_tokens": 100, |
|
"do_sample": False |
|
|
|
} |
|
|
|
|
|
with torch.no_grad(): |
|
outputs = model_gen.generate(input_ids=inputs, **generation_kwargs) |
|
|
|
|
|
respuesta_en = tokenizer_gen.decode(outputs[0], skip_special_tokens=True) |
|
|
|
|
|
if idioma_destino in translation_models: |
|
tokenizer_tr = tokenizer_trans[idioma_destino] |
|
model_tr = model_trans[idioma_destino] |
|
|
|
|
|
traducir_inputs = tokenizer_tr.prepare_seq2seq_batch([respuesta_en], return_tensors="pt").to(device) |
|
|
|
|
|
with torch.no_grad(): |
|
traduccion_outputs = model_tr.generate(**traducir_inputs) |
|
|
|
|
|
respuesta_traducida = tokenizer_tr.decode(traduccion_outputs[0], skip_special_tokens=True) |
|
else: |
|
respuesta_traducida = "Idioma de destino no soportado." |
|
|
|
return respuesta_en, respuesta_traducida |
|
except Exception as e: |
|
print(f"Error durante la generaci贸n o traducci贸n de la respuesta: {e}") |
|
return f"Error al generar la respuesta: {e}", "" |
|
|
|
|
|
titulo = "Generador y Traductor de Respuestas con SelfBioRAG 7B" |
|
descripcion = ( |
|
"Ingresa una consulta y el modelo generar谩 una respuesta en ingl茅s. " |
|
"Luego, puedes seleccionar un idioma para traducir la respuesta generada." |
|
) |
|
|
|
idiomas_disponibles = list(translation_models.keys()) |
|
|
|
iface = gr.Interface( |
|
fn=generar_y_traducir_respuesta, |
|
inputs=[ |
|
gr.Textbox(lines=5, placeholder="Escribe tu consulta aqu铆...", label="Consulta"), |
|
gr.Dropdown(choices=idiomas_disponibles, value="Espa帽ol", label="Idioma de Traducci贸n") |
|
], |
|
outputs=[ |
|
gr.Textbox(label="Respuesta en Ingl茅s"), |
|
gr.Textbox(label="Respuesta Traducida") |
|
], |
|
title=titulo, |
|
description=descripcion, |
|
examples=[ |
|
[ |
|
"Clasifica el siguiente informe de radiolog铆a seg煤n la parte del cuerpo a la que se refiere (por ejemplo, pecho, abdomen, cerebro, etc.): Los discos intervertebrales en L4-L5 y L5-S1 muestran signos de degeneraci贸n con leve abultamiento que comprime la ra铆z nerviosa adyacente.", |
|
"Espa帽ol" |
|
], |
|
[ |
|
"Resume los puntos clave sobre el papel de las mutaciones en los genes BRCA1 y BRCA2 en el aumento del riesgo de c谩ncer de mama.", |
|
"Portugu茅s" |
|
] |
|
], |
|
cache_examples=False |
|
) |
|
|
|
|
|
if __name__ == "__main__": |
|
iface.launch() |
|
|