Spaces:
Sleeping
Sleeping
Update README.md
Browse files
README.md
CHANGED
@@ -10,38 +10,40 @@ pinned: false
|
|
10 |
license: apache-2.0
|
11 |
short_description: Snap a dish photo and let S2C turn it into a recipe!
|
12 |
---
|
13 |
-
# Proyecto: Generador de Recetas desde Imágenes de
|
14 |
|
15 |
## Descripción General del Proyecto
|
16 |
|
17 |
-
Este proyecto consiste en una aplicación interactiva capaz de generar una receta detallada, incluyendo la lista de ingredientes y el paso a paso para cocinar un
|
18 |
|
19 |
## Problema a Resolver
|
20 |
|
21 |
-
En muchas ocasiones, una persona puede ver un
|
22 |
|
23 |
### Solución Propuesta
|
24 |
|
25 |
-
La solución consiste en un espacio interactivo en Hugging Face donde los usuarios pueden cargar una imagen de un
|
26 |
|
27 |
- Una lista de ingredientes con cantidades exactas.
|
28 |
-
- Instrucciones paso a paso para cocinar el
|
29 |
|
30 |
#### Flujo de Trabajo
|
31 |
|
32 |
-
1. **Input**: El usuario sube una imagen de un
|
33 |
2. **Proceso**:
|
34 |
-
- **Modelo 1**: Se utiliza un modelo de "image-to-text" (Salesforce/blip-image-captioning-base) para generar una descripción del
|
35 |
- **Modelo 2**: Con la descripción generada, se utiliza un modelo de generación de lenguaje (Qwen/Qwen2.5-72B-Instruct) para generar la receta con la lista de ingredientes y las instrucciones paso a paso.
|
36 |
-
3. **Output**: El usuario recibe la descripción del
|
37 |
|
38 |
## Modelos Utilizados
|
39 |
|
40 |
1. **Salesforce/blip-image-captioning-base** (Clasificación: Image-to-Text):
|
41 |
-
|
42 |
-
-
|
|
|
43 |
|
44 |
2. **Qwen/Qwen2.5-72B-Instruct** (Clasificación: Language Generation):
|
|
|
45 |
- Se utiliza para crear una receta detallada basada en la descripción proporcionada por el primer modelo. Este modelo está entrenado para generar textos instructivos y responder de manera amigable.
|
46 |
- **Limitaciones**: La calidad de la receta puede depender de la claridad de la descripción inicial. Además, la generación de lenguaje puede ser propensa a la repetición o a ciertos errores si no se establece un buen control en los parámetros de generación.
|
47 |
|
@@ -49,8 +51,22 @@ La solución consiste en un espacio interactivo en Hugging Face donde los usuari
|
|
49 |
|
50 |
La aplicación está diseñada para ser intuitiva y amigable, permitiendo al usuario:
|
51 |
|
52 |
-
- Subir una imagen del
|
53 |
- Recibir una descripción de la imagen, junto con una receta completa.
|
54 |
- Descargar la receta generada en un archivo para su comodidad.
|
55 |
|
56 |
-
La interfaz ha sido desarrollada usando **Gradio** para proporcionar una experiencia sencilla y clara para cualquier tipo de usuario, sin importar su nivel de conocimientos técnicos.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
10 |
license: apache-2.0
|
11 |
short_description: Snap a dish photo and let S2C turn it into a recipe!
|
12 |
---
|
13 |
+
# Proyecto: Generador de Recetas desde Imágenes de Platos de Comida
|
14 |
|
15 |
## Descripción General del Proyecto
|
16 |
|
17 |
+
Este proyecto consiste en una aplicación interactiva capaz de generar una receta detallada, incluyendo la lista de ingredientes y el paso a paso para cocinar un plato de comida, a partir de una imagen del mismo. La solución se basa en la combinación de dos modelos preentrenados disponibles en Hugging Face: un modelo de “image-to-text” para la descripción del plato de comida, y un modelo de generación de lenguaje para crear la receta a partir de esa descripción.
|
18 |
|
19 |
## Problema a Resolver
|
20 |
|
21 |
+
En muchas ocasiones, una persona puede ver un plato de comida atractivo en un restaurante, un evento o incluso en redes sociales, y quiere recrearlo en casa. Sin embargo, no siempre sabe cuáles son los ingredientes o los pasos necesarios para prepararlo. Este proyecto pretende ayudar a los usuarios proporcionando una receta detallada a partir de una imagen del plato de comida, eliminando la necesidad de realizar búsquedas complejas o depender de conocimientos previos sobre cocina.
|
22 |
|
23 |
### Solución Propuesta
|
24 |
|
25 |
+
La solución consiste en un espacio interactivo en Hugging Face donde los usuarios pueden cargar una imagen de un plato de comida y recibir una receta detallada que incluya:
|
26 |
|
27 |
- Una lista de ingredientes con cantidades exactas.
|
28 |
+
- Instrucciones paso a paso para cocinar el plato de comida.
|
29 |
|
30 |
#### Flujo de Trabajo
|
31 |
|
32 |
+
1. **Input**: El usuario sube una imagen de un plato de comida a la interfaz.
|
33 |
2. **Proceso**:
|
34 |
+
- **Modelo 1**: Se utiliza un modelo de "image-to-text" (Salesforce/blip-image-captioning-base) para generar una descripción del plato de comida a partir de la imagen.
|
35 |
- **Modelo 2**: Con la descripción generada, se utiliza un modelo de generación de lenguaje (Qwen/Qwen2.5-72B-Instruct) para generar la receta con la lista de ingredientes y las instrucciones paso a paso.
|
36 |
+
3. **Output**: El usuario recibe la descripción del plato de comida, la receta generada y la opción de descargarla en un archivo.
|
37 |
|
38 |
## Modelos Utilizados
|
39 |
|
40 |
1. **Salesforce/blip-image-captioning-base** (Clasificación: Image-to-Text):
|
41 |
+
|
42 |
+
- Este modelo se utiliza para analizar la imagen subida por el usuario y generar una descripción textual del plato de comida.
|
43 |
+
- **Limitaciones**: Puede tener dificultades para generar descripciones precisas si la imagen está desenfocada, tiene múltiples platos de comida o está obstruida.
|
44 |
|
45 |
2. **Qwen/Qwen2.5-72B-Instruct** (Clasificación: Language Generation):
|
46 |
+
|
47 |
- Se utiliza para crear una receta detallada basada en la descripción proporcionada por el primer modelo. Este modelo está entrenado para generar textos instructivos y responder de manera amigable.
|
48 |
- **Limitaciones**: La calidad de la receta puede depender de la claridad de la descripción inicial. Además, la generación de lenguaje puede ser propensa a la repetición o a ciertos errores si no se establece un buen control en los parámetros de generación.
|
49 |
|
|
|
51 |
|
52 |
La aplicación está diseñada para ser intuitiva y amigable, permitiendo al usuario:
|
53 |
|
54 |
+
- Subir una imagen del plato de comida.
|
55 |
- Recibir una descripción de la imagen, junto con una receta completa.
|
56 |
- Descargar la receta generada en un archivo para su comodidad.
|
57 |
|
58 |
+
La interfaz ha sido desarrollada usando **Gradio** para proporcionar una experiencia sencilla y clara para cualquier tipo de usuario, sin importar su nivel de conocimientos técnicos.
|
59 |
+
|
60 |
+
## Publicación del Proyecto
|
61 |
+
|
62 |
+
El proyecto será alojado en un **Space de Hugging Face**, bajo la organización del **IES Rafael Alberti**. En la descripción del Space se incluirán los siguientes puntos:
|
63 |
+
|
64 |
+
- **Objetivo del Proyecto**: Descripción del problema que se busca resolver.
|
65 |
+
- **Input y Output del Sistema**: Información detallada sobre los datos de entrada y salida esperados.
|
66 |
+
- **Modelos Utilizados**: Explicación sobre los modelos empleados y sus limitaciones.
|
67 |
+
- **Instrucciones para el Usuario**: Guía sobre cómo utilizar la interfaz.
|
68 |
+
|
69 |
+
## Entrega
|
70 |
+
|
71 |
+
El proyecto será entregado mediante la URL al **Space en producción**. Asegúrate de verificar la descripción y que cumpla con las rubricas solicitadas antes de la entrega final.
|
72 |
+
|