Spaces:

Yjhhh
/

Train

Runtime error

App Files Files Community

Yjhhh commited on Sep 8, 2024

Commit

9df8ce5

verified ·

1 Parent(s): a6520e3

Update main.py

Browse files

Files changed (1) hide show

main.py +28 -11

main.py CHANGED Viewed

@@ -29,6 +29,7 @@ REDIS_PASSWORD = os.getenv('REDIS_PASSWORD')
 app = FastAPI()
 language_responses = {
     "es": {
         0: [
@@ -46,6 +47,7 @@ language_responses = {
             "¿En qué puedo ayudarte?",
             "Dime, ¿qué necesitas?"
         ],
     },
     "en": {
         0: [
@@ -63,30 +65,39 @@ language_responses = {
             "What can I do for you?",
             "Tell me, what do you need?"
         ],
     }
 }
-default_language = "es"
 class ChatbotService:
     def get_response(self, user_id, message, predicted_class, language=default_language):
         responses = language_responses.get(language, language_responses["es"])
         if predicted_class == 1:
             return random.choice(responses[1])
         elif predicted_class == 2:
             return random.choice(responses[2])
         else:
             return random.choice(responses[0])
 chatbot_service = ChatbotService()
 class UnifiedModel(nn.Module):
     def __init__(self, models):
         super(UnifiedModel, self).__init__()
         self.models = nn.ModuleList(models)
         hidden_size = self.models[0].config.hidden_size
-        self.projection = nn.Linear(len(models) * hidden_size, hidden_size)
-        self.classifier = nn.Linear(hidden_size, 3)
     def forward(self, input_ids, attention_mask):
         hidden_states = []
@@ -95,10 +106,10 @@ class UnifiedModel(nn.Module):
                 input_ids=input_id,
                 attention_mask=attn_mask
             )
-            hidden_states.append(outputs.logits)
         concatenated_hidden_states = torch.cat(hidden_states, dim=1)
-        projected_features = self.projection(concatenated_hidden_states)
         logits = self.classifier(projected_features)
         return logits
@@ -107,13 +118,14 @@ class UnifiedModel(nn.Module):
         model_name = "unified_model"
         model_data_bytes = redis_client.get(f"model:{model_name}")
         if model_data_bytes:
-            model = AutoModelForSequenceClassification.from_pretrained("gpt2", num_labels=3)
             model.load_state_dict(torch.load(model_data_bytes))
         else:
-            model = AutoModelForSequenceClassification.from_pretrained("gpt2", num_labels=3)
-        return UnifiedModel([model, model])
 class SyntheticDataset(Dataset):
     def __init__(self, tokenizers, data):
         self.tokenizers = tokenizers
@@ -134,6 +146,7 @@ class SyntheticDataset(Dataset):
         tokenized["labels"] = torch.tensor(label)
         return tokenized
 conversation_history = {}
 @app.post("/process")
@@ -151,10 +164,10 @@ async def process(request: Request):
     tokenizer_data_bytes = redis_client.get(f"tokenizer:{tokenizer_name}")
     if model_data_bytes:
-        model = AutoModelForSequenceClassification.from_pretrained("gpt2", num_labels=3)
         model.load_state_dict(torch.load(model_data_bytes))
     else:
-        model = AutoModelForSequenceClassification.from_pretrained("gpt2", num_labels=3)
     models[model_name] = model
     if tokenizer_data_bytes:
@@ -174,6 +187,7 @@ async def process(request: Request):
                 {"text": "Hola", "label": 1},
                 {"text": "Necesito ayuda", "label": 2},
                 {"text": "No entiendo", "label": 0}
             ]
         redis_client.rpush("training_queue", json.dumps({
@@ -188,11 +202,13 @@ async def process(request: Request):
         text = data['message']
         language = data.get("language", default_language)
         if user_id not in conversation_history:
             conversation_history[user_id] = []
         conversation_history[user_id].append(text)
-        contextualized_text = " ".join(conversation_history[user_id][-3:])
         tokenized_inputs = [tokenizers[name](contextualized_text, return_tensors="pt") for name in tokenizers.keys()]
         input_ids = [tokens['input_ids'] for tokens in tokenized_inputs]
@@ -209,6 +225,7 @@ async def process(request: Request):
         raise HTTPException(status_code=400, detail="Request must contain 'train' or 'message'.")
 def get_chatbot_response(user_id, question, predicted_class, language):
     if user_id not in conversation_history:
         conversation_history[user_id] = []
     conversation_history[user_id].append(question)

 app = FastAPI()
+# Configuración de idioma
 language_responses = {
     "es": {
         0: [
             "¿En qué puedo ayudarte?",
             "Dime, ¿qué necesitas?"
         ],
+        # ... más respuestas para otras clases
     },
     "en": {
         0: [
             "What can I do for you?",
             "Tell me, what do you need?"
         ],
+        # ... más respuestas para otras clases
     }
 }
+default_language = "es"  # Idioma predeterminado
+# Servicio de Chatbot
 class ChatbotService:
     def get_response(self, user_id, message, predicted_class, language=default_language):
+        # Accede al diccionario de respuestas según el idioma
         responses = language_responses.get(language, language_responses["es"])
+        # Lógica basada en la clase predicha
         if predicted_class == 1:
+            # Seleccionar una respuesta de saludo aleatoria
             return random.choice(responses[1])
         elif predicted_class == 2:
+            # Seleccionar una respuesta de ayuda aleatoria
             return random.choice(responses[2])
         else:
+            # Seleccionar una respuesta de no comprensión aleatoria
             return random.choice(responses[0])
 chatbot_service = ChatbotService()
+# Modelo de clasificación de texto
 class UnifiedModel(nn.Module):
     def __init__(self, models):
         super(UnifiedModel, self).__init__()
         self.models = nn.ModuleList(models)
         hidden_size = self.models[0].config.hidden_size
+        self.projection = nn.Linear(len(models) * 3, 768)  # Dimensión de salida corregida
+        self.classifier = nn.Linear(hidden_size, 3) # 3 clases
     def forward(self, input_ids, attention_mask):
         hidden_states = []
                 input_ids=input_id,
                 attention_mask=attn_mask
             )
+            hidden_states.append(outputs.logits)  # Usar directamente outputs.logits
         concatenated_hidden_states = torch.cat(hidden_states, dim=1)
+        projected_features = self.projection(concatenated_hidden_states) # Proyectar a hidden_size
         logits = self.classifier(projected_features)
         return logits
         model_name = "unified_model"
         model_data_bytes = redis_client.get(f"model:{model_name}")
         if model_data_bytes:
+            model = AutoModelForSequenceClassification.from_pretrained("gpt2", num_labels=3) # 3 clases
             model.load_state_dict(torch.load(model_data_bytes))
         else:
+            model = AutoModelForSequenceClassification.from_pretrained("gpt2", num_labels=3) # 3 clases
+        return UnifiedModel([model, model]) # Asegurar que se usa una lista de modelos, en este caso 2
+# Dataset para entrenamiento
 class SyntheticDataset(Dataset):
     def __init__(self, tokenizers, data):
         self.tokenizers = tokenizers
         tokenized["labels"] = torch.tensor(label)
         return tokenized
+# Manejo de la conversación
 conversation_history = {}
 @app.post("/process")
     tokenizer_data_bytes = redis_client.get(f"tokenizer:{tokenizer_name}")
     if model_data_bytes:
+        model = AutoModelForSequenceClassification.from_pretrained("gpt2", num_labels=3) # 3 clases
         model.load_state_dict(torch.load(model_data_bytes))
     else:
+        model = AutoModelForSequenceClassification.from_pretrained("gpt2", num_labels=3) # 3 clases
     models[model_name] = model
     if tokenizer_data_bytes:
                 {"text": "Hola", "label": 1},
                 {"text": "Necesito ayuda", "label": 2},
                 {"text": "No entiendo", "label": 0}
+                # ... más ejemplos para otras clases
             ]
         redis_client.rpush("training_queue", json.dumps({
         text = data['message']
         language = data.get("language", default_language)
+        # Memoria de Conversación
         if user_id not in conversation_history:
             conversation_history[user_id] = []
         conversation_history[user_id].append(text)
+        # Concatenar el historial al mensaje actual (puedes usar otra técnica)
+        contextualized_text = " ".join(conversation_history[user_id][-3:]) # Usar los últimos 3 mensajes
         tokenized_inputs = [tokenizers[name](contextualized_text, return_tensors="pt") for name in tokenizers.keys()]
         input_ids = [tokens['input_ids'] for tokens in tokenized_inputs]
         raise HTTPException(status_code=400, detail="Request must contain 'train' or 'message'.")
 def get_chatbot_response(user_id, question, predicted_class, language):
+    # Almacenar el mensaje en el historial
     if user_id not in conversation_history:
         conversation_history[user_id] = []
     conversation_history[user_id].append(question)