Spaces:

lilmeaty
/

aws

Sleeping

App Files Files Community

Hjgugugjhuhjggg commited on Dec 5, 2024

Commit

9214e9b

verified ·

1 Parent(s): ebec48b

Update app.py

Browse files

Files changed (1) hide show

app.py +86 -37

app.py CHANGED Viewed

@@ -4,11 +4,12 @@ import boto3
 from fastapi import FastAPI, HTTPException
 from pydantic import BaseModel
 from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
-from safetensors.torch import load_file
 import torch
 import asyncio
-# Configuración de logs
 logger = logging.getLogger(__name__)
 logger.setLevel(logging.INFO)
 console_handler = logging.StreamHandler()
@@ -16,7 +17,6 @@ formatter = logging.Formatter('%(asctime)s - %(levelname)s - %(message)s')
 console_handler.setFormatter(formatter)
 logger.addHandler(console_handler)
-# Configuración de AWS y S3
 AWS_ACCESS_KEY_ID = os.getenv("AWS_ACCESS_KEY_ID")
 AWS_SECRET_ACCESS_KEY = os.getenv("AWS_SECRET_ACCESS_KEY")
 AWS_REGION = os.getenv("AWS_REGION")
@@ -32,16 +32,13 @@ s3_client = boto3.client(
     region_name=AWS_REGION
 )
-# Crear la aplicación FastAPI
 app = FastAPI()
-# Modelo de datos para la solicitud
 class GenerateRequest(BaseModel):
     model_name: str
     input_text: str
-    task_type: str
-# Clase para gestionar el acceso a S3
 class S3DirectStream:
     def __init__(self, bucket_name):
         self.s3_client = boto3.client(
@@ -52,63 +49,102 @@ class S3DirectStream:
         )
         self.bucket_name = bucket_name
-    # Función para obtener el archivo desde S3
     async def stream_from_s3(self, key):
         loop = asyncio.get_event_loop()
         return await loop.run_in_executor(None, self._stream_from_s3, key)
     def _stream_from_s3(self, key):
         try:
             response = self.s3_client.get_object(Bucket=self.bucket_name, Key=key)
-            file_content = response['Body'].read()
-            if not file_content:
-                raise HTTPException(status_code=404, detail=f"El archivo {key} está vacío.")
             return file_content
         except self.s3_client.exceptions.NoSuchKey:
             raise HTTPException(status_code=404, detail=f"El archivo {key} no existe en el bucket S3.")
         except Exception as e:
             raise HTTPException(status_code=500, detail=f"Error al descargar {key} desde S3: {str(e)}")
-    # Cargar el modelo directamente desde S3
     async def load_model_from_s3(self, model_name):
         try:
             model_name = model_name.replace("/", "-").lower()
             model_bytes = await self.stream_from_s3(f"{model_name}/pytorch_model.bin")
-            if model_bytes:
-                model = load_file(model_bytes)
-                return model
-            model = AutoModelForCausalLM.from_pretrained(f"s3://{self.bucket_name}/{model_name}/pytorch_model.bin")
             return model
         except HTTPException as e:
             raise e
         except Exception as e:
             raise HTTPException(status_code=500, detail=f"Error al cargar el modelo desde S3: {e}")
-    # Cargar el tokenizer desde S3
     async def load_tokenizer_from_s3(self, model_name):
         try:
             model_name = model_name.replace("/", "-").lower()
             tokenizer_bytes = await self.stream_from_s3(f"{model_name}/tokenizer.json")
-            if not tokenizer_bytes:
-                raise HTTPException(status_code=404, detail="El archivo tokenizer.json está vacío o no existe.")
-            tokenizer = AutoTokenizer.from_pretrained(f"s3://{self.bucket_name}/{model_name}/tokenizer.json")
             return tokenizer
         except Exception as e:
             raise HTTPException(status_code=500, detail=f"Error al cargar el tokenizer desde S3: {e}")
-    # Obtener los archivos del modelo desde S3
-    async def get_model_file_parts(self, model_name):
         try:
             model_name = model_name.replace("/", "-").lower()
-            files = self.s3_client.list_objects_v2(Bucket=self.bucket_name, Prefix=model_name)
-            model_files = [obj['Key'] for obj in files.get('Contents', []) if model_name in obj['Key']]
-            if not model_files:
-                raise HTTPException(status_code=404, detail=f"Archivos del modelo {model_name} no encontrados.")
-            return model_files
         except Exception as e:
-            raise HTTPException(status_code=500, detail=f"Error al obtener archivos del modelo {model_name} desde S3: {e}")
-# Endpoint para la generación
 @app.post("/generate")
 async def generate(request: GenerateRequest):
     try:
@@ -116,41 +152,54 @@ async def generate(request: GenerateRequest):
         model_name = request.model_name
         input_text = request.input_text
         s3_direct_stream = S3DirectStream(S3_BUCKET_NAME)
-        # Cargar el modelo y tokenizer desde S3
         model = await s3_direct_stream.load_model_from_s3(model_name)
         tokenizer = await s3_direct_stream.load_tokenizer_from_s3(model_name)
-        # Generar dependiendo del tipo de tarea
         if task_type == "text-to-text":
             generator = pipeline("text-generation", model=model, tokenizer=tokenizer, device=0)
             result = generator(input_text, max_length=MAX_TOKENS, num_return_sequences=1)
             return {"result": result[0]["generated_text"]}
         elif task_type == "text-to-image":
             generator = pipeline("text-to-image", model=model, tokenizer=tokenizer, device=0)
             image = generator(input_text)
             return {"image": image}
-        elif task_type == "text-to-audio" or task_type == "text-to-speech":
-            generator = pipeline("text-to-speech", model=model, tokenizer=tokenizer, device=0)
-            audio = generator(input_text)
-            return {"audio": audio}
         elif task_type == "text-to-video":
             generator = pipeline("text-to-video", model=model, tokenizer=tokenizer, device=0)
             video = generator(input_text)
             return {"video": video}
         else:
             raise HTTPException(status_code=400, detail="Tipo de tarea no soportado.")
     except HTTPException as e:
         raise e
     except Exception as e:
         raise HTTPException(status_code=500, detail=f"Error en la generación: {str(e)}")
-# Ejecutar la aplicación
 if __name__ == "__main__":
     import uvicorn
     uvicorn.run(app, host="0.0.0.0", port=7860)

 from fastapi import FastAPI, HTTPException
 from pydantic import BaseModel
 from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
+from huggingface_hub import hf_hub_download
 import torch
+import safetensors
 import asyncio
+from tqdm import tqdm  # Importar tqdm para la barra de progreso
 logger = logging.getLogger(__name__)
 logger.setLevel(logging.INFO)
 console_handler = logging.StreamHandler()
 console_handler.setFormatter(formatter)
 logger.addHandler(console_handler)
 AWS_ACCESS_KEY_ID = os.getenv("AWS_ACCESS_KEY_ID")
 AWS_SECRET_ACCESS_KEY = os.getenv("AWS_SECRET_ACCESS_KEY")
 AWS_REGION = os.getenv("AWS_REGION")
     region_name=AWS_REGION
 )
 app = FastAPI()
 class GenerateRequest(BaseModel):
     model_name: str
     input_text: str
+    task_type: str  # Added task type to handle different tasks (e.g., text-to-image, text-to-speech)
 class S3DirectStream:
     def __init__(self, bucket_name):
         self.s3_client = boto3.client(
         )
         self.bucket_name = bucket_name
     async def stream_from_s3(self, key):
         loop = asyncio.get_event_loop()
         return await loop.run_in_executor(None, self._stream_from_s3, key)
     def _stream_from_s3(self, key):
         try:
+            logger.info(f"Descargando archivo {key} desde S3...")
             response = self.s3_client.get_object(Bucket=self.bucket_name, Key=key)
+            file_content = response['Body'].read()  # This returns a bytes object
             return file_content
         except self.s3_client.exceptions.NoSuchKey:
             raise HTTPException(status_code=404, detail=f"El archivo {key} no existe en el bucket S3.")
         except Exception as e:
+            logger.error(f"Error al descargar {key} desde S3: {str(e)}")
             raise HTTPException(status_code=500, detail=f"Error al descargar {key} desde S3: {str(e)}")
+    async def get_model_file_parts(self, model_name):
+        loop = asyncio.get_event_loop()
+        return await loop.run_in_executor(None, self._get_model_file_parts, model_name)
+    def _get_model_file_parts(self, model_name):
+        try:
+            model_name = model_name.replace("/", "-").lower()
+            logger.info(f"Obteniendo archivos del modelo {model_name} desde S3...")
+            files = self.s3_client.list_objects_v2(Bucket=self.bucket_name, Prefix=model_name)
+            model_files = [obj['Key'] for obj in files.get('Contents', []) if model_name in obj['Key']]
+            if not model_files:
+                raise HTTPException(status_code=404, detail=f"Archivos del modelo {model_name} no encontrados.")
+            return model_files
+        except Exception as e:
+            raise HTTPException(status_code=500, detail=f"Error al obtener archivos del modelo {model_name} desde S3: {e}")
     async def load_model_from_s3(self, model_name):
         try:
+            logger.info(f"Cargando modelo {model_name} desde S3...")
             model_name = model_name.replace("/", "-").lower()
+            model_files = await self.get_model_file_parts(model_name)
+            if 'pytorch_model.bin' not in model_files:
+                raise HTTPException(status_code=404, detail="Archivo 'pytorch_model.bin' no encontrado en S3")
+            if 'tokenizer.json' not in model_files:
+                raise HTTPException(status_code=404, detail="Archivo 'tokenizer.json' no encontrado en S3")
             model_bytes = await self.stream_from_s3(f"{model_name}/pytorch_model.bin")
+            logger.info(f"Modelo descargado correctamente. Cargando el modelo en memoria...")
+            model = AutoModelForCausalLM.from_pretrained(model_bytes, config=model_name)
             return model
         except HTTPException as e:
             raise e
         except Exception as e:
+            logger.error(f"Error al cargar el modelo desde S3: {e}")
             raise HTTPException(status_code=500, detail=f"Error al cargar el modelo desde S3: {e}")
     async def load_tokenizer_from_s3(self, model_name):
         try:
+            logger.info(f"Cargando tokenizer del modelo {model_name} desde S3...")
             model_name = model_name.replace("/", "-").lower()
             tokenizer_bytes = await self.stream_from_s3(f"{model_name}/tokenizer.json")
+            tokenizer = AutoTokenizer.from_pretrained(tokenizer_bytes)
             return tokenizer
         except Exception as e:
+            logger.error(f"Error al cargar el tokenizer desde S3: {e}")
             raise HTTPException(status_code=500, detail=f"Error al cargar el tokenizer desde S3: {e}")
+    async def download_and_upload_to_s3(self, model_name, force_download=False):
         try:
+            if force_download:
+                logger.info(f"Forzando la descarga del modelo {model_name} y la carga a S3.")
             model_name = model_name.replace("/", "-").lower()
+            if not await self.file_exists_in_s3(f"{model_name}/pytorch_model.bin") or not await self.file_exists_in_s3(f"{model_name}/tokenizer.json"):
+                logger.info(f"Descargando archivos del modelo {model_name} desde Hugging Face...")
+                model_file = hf_hub_download(repo_id=model_name, filename="pytorch_model.bin", token=HUGGINGFACE_HUB_TOKEN, force_download=force_download)
+                tokenizer_file = hf_hub_download(repo_id=model_name, filename="tokenizer.json", token=HUGGINGFACE_HUB_TOKEN, force_download=force_download)
+                await self.create_s3_folders(f"{model_name}/")
+                if not await self.file_exists_in_s3(f"{model_name}/pytorch_model.bin"):
+                    with open(model_file, "rb") as file:
+                        logger.info(f"Cargando archivo {model_name}/pytorch_model.bin a S3...")
+                        self.s3_client.put_object(Bucket=self.bucket_name, Key=f"{model_name}/pytorch_model.bin", Body=file)
+                if not await self.file_exists_in_s3(f"{model_name}/tokenizer.json"):
+                    with open(tokenizer_file, "rb") as file:
+                        logger.info(f"Cargando archivo {model_name}/tokenizer.json a S3...")
+                        self.s3_client.put_object(Bucket=self.bucket_name, Key=f"{model_name}/tokenizer.json", Body=file)
+            else:
+                logger.info(f"Los archivos del modelo {model_name} ya existen en S3. No es necesario descargarlos de nuevo.")
         except Exception as e:
+            logger.error(f"Error al descargar o cargar archivos desde Hugging Face a S3: {e}")
+            raise HTTPException(status_code=500, detail=f"Error al descargar o cargar archivos desde Hugging Face a S3: {e}")
 @app.post("/generate")
 async def generate(request: GenerateRequest):
     try:
         model_name = request.model_name
         input_text = request.input_text
+        logger.info(f"Iniciando la generación para el modelo {model_name} con el tipo de tarea {task_type}...")
         s3_direct_stream = S3DirectStream(S3_BUCKET_NAME)
         model = await s3_direct_stream.load_model_from_s3(model_name)
         tokenizer = await s3_direct_stream.load_tokenizer_from_s3(model_name)
+        logger.info(f"Modelo y tokenizer cargados correctamente. Procesando tarea {task_type}...")
         if task_type == "text-to-text":
             generator = pipeline("text-generation", model=model, tokenizer=tokenizer, device=0)
             result = generator(input_text, max_length=MAX_TOKENS, num_return_sequences=1)
+            logger.info(f"Generación completada: {result[0]['generated_text']}")
             return {"result": result[0]["generated_text"]}
         elif task_type == "text-to-image":
             generator = pipeline("text-to-image", model=model, tokenizer=tokenizer, device=0)
             image = generator(input_text)
+            logger.info(f"Imagen generada.")
             return {"image": image}
         elif task_type == "text-to-video":
             generator = pipeline("text-to-video", model=model, tokenizer=tokenizer, device=0)
             video = generator(input_text)
+            logger.info(f"Video generado.")
             return {"video": video}
+        elif task_type == "text-to-speech":
+            generator = pipeline("text-to-speech", model=model, tokenizer=tokenizer, device=0)
+            audio = generator(input_text)
+            logger.info(f"Audio generado.")
+            return {"audio": audio}
+        elif task_type == "text-to-audio":
+            generator = pipeline("text-to-audio", model=model, tokenizer=tokenizer, device=0)
+            audio = generator(input_text)
+            logger.info(f"Audio generado.")
+            return {"audio": audio}
         else:
             raise HTTPException(status_code=400, detail="Tipo de tarea no soportado.")
     except HTTPException as e:
         raise e
     except Exception as e:
         raise HTTPException(status_code=500, detail=f"Error en la generación: {str(e)}")
 if __name__ == "__main__":
     import uvicorn
     uvicorn.run(app, host="0.0.0.0", port=7860)