Spaces:

daniescamilla
/

snap-to-chef

Sleeping

App Files Files Community

daniescamilla commited on Nov 18, 2024

Commit

d52c961

verified ·

1 Parent(s): 5c39e0b

Update README.md

Browse files

Files changed (1) hide show

README.md +44 -2

README.md CHANGED Viewed

@@ -9,6 +9,48 @@ app_file: app.py
 pinned: false
 license: apache-2.0
 short_description: Snap a dish photo and let S2C turn it into a recipe!
----
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 pinned: false
 license: apache-2.0
 short_description: Snap a dish photo and let S2C turn it into a recipe!
+# Proyecto: Generador de Recetas desde Imágenes de Platillos
+## Descripción General del Proyecto
+Este proyecto consiste en una aplicación interactiva capaz de generar una receta detallada, incluyendo la lista de ingredientes y el paso a paso para cocinar un platillo, a partir de una imagen del mismo. La solución se basa en la combinación de dos modelos preentrenados disponibles en Hugging Face: un modelo de “image-to-text” para la descripción del platillo, y un modelo de generación de lenguaje para crear la receta a partir de esa descripción.
+## Problema a Resolver
+En muchas ocasiones, una persona puede ver un platillo atractivo en un restaurante, un evento o incluso en redes sociales, y quiere recrearlo en casa. Sin embargo, no siempre sabe cuáles son los ingredientes o los pasos necesarios para prepararlo. Este proyecto pretende ayudar a los usuarios proporcionando una receta detallada a partir de una imagen del platillo, eliminando la necesidad de realizar búsquedas complejas o depender de conocimientos previos sobre cocina.
+### Solución Propuesta
+La solución consiste en un espacio interactivo en Hugging Face donde los usuarios pueden cargar una imagen de un platillo y recibir una receta detallada que incluya:
+- Una lista de ingredientes con cantidades exactas.
+- Instrucciones paso a paso para cocinar el platillo.
+#### Flujo de Trabajo
+1. **Input**: El usuario sube una imagen de un platillo a la interfaz.
+2. **Proceso**:
+   - **Modelo 1**: Se utiliza un modelo de "image-to-text" (Salesforce/blip-image-captioning-base) para generar una descripción del platillo a partir de la imagen.
+   - **Modelo 2**: Con la descripción generada, se utiliza un modelo de generación de lenguaje (Qwen/Qwen2.5-72B-Instruct) para generar la receta con la lista de ingredientes y las instrucciones paso a paso.
+3. **Output**: El usuario recibe la descripción del platillo, la receta generada y la opción de descargarla en un archivo.
+## Modelos Utilizados
+1. **Salesforce/blip-image-captioning-base** (Clasificación: Image-to-Text):
+   - Este modelo se utiliza para analizar la imagen subida por el usuario y generar una descripción textual del platillo.
+   - **Limitaciones**: Puede tener dificultades para generar descripciones precisas si la imagen está desenfocada, tiene múltiples platillos o está obstruida.
+2. **Qwen/Qwen2.5-72B-Instruct** (Clasificación: Language Generation):
+   - Se utiliza para crear una receta detallada basada en la descripción proporcionada por el primer modelo. Este modelo está entrenado para generar textos instructivos y responder de manera amigable.
+   - **Limitaciones**: La calidad de la receta puede depender de la claridad de la descripción inicial. Además, la generación de lenguaje puede ser propensa a la repetición o a ciertos errores si no se establece un buen control en los parámetros de generación.
+## Interfaz de Usuario
+La aplicación está diseñada para ser intuitiva y amigable, permitiendo al usuario:
+- Subir una imagen del platillo.
+- Recibir una descripción de la imagen, junto con una receta completa.
+- Descargar la receta generada en un archivo para su comodidad.
+La interfaz ha sido desarrollada usando **Gradio** para proporcionar una experiencia sencilla y clara para cualquier tipo de usuario, sin importar su nivel de conocimientos técnicos.