Spaces:

brightlembo
/

SY23

Sleeping

App Files Files Community

brightlembo commited on Jan 17

Commit

d0f1298

verified ·

1 Parent(s): d63c5ba

Update app.py

Browse files

Files changed (1) hide show

app.py +28 -4

app.py CHANGED Viewed

@@ -10,6 +10,9 @@ from transformers import (
 from PIL import Image
 import os
 import logging
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
@@ -28,6 +31,8 @@ class MultimodalProcessor:
                                            model="openai/whisper-small")
             self.text_generator = pipeline("text-generation",
                                         model="gpt2")
             logger.info("Modèles chargés avec succès")
         except Exception as e:
             logger.error(f"Erreur lors du chargement des modèles: {str(e)}")
@@ -88,6 +93,20 @@ class MultimodalProcessor:
             logger.error(f"Erreur lors de la génération de texte: {str(e)}")
             return "Erreur lors de la génération de texte."
     def process_inputs(self, image, audio, text):
         """Traite les entrées multimodales"""
         try:
@@ -112,11 +131,14 @@ class MultimodalProcessor:
             else:
                 final_prompt = "Aucune entrée fournie."
-            return final_prompt
         except Exception as e:
             logger.error(f"Erreur lors du traitement des entrées: {str(e)}")
-            return "Une erreur est survenue lors du traitement des entrées."
 def create_interface():
     """Crée l'interface Gradio"""
@@ -130,7 +152,8 @@ def create_interface():
             gr.Textbox(label="Entrez du texte additionnel")
         ],
         outputs=[
-            gr.Textbox(label="Description générée")
         ],
         title="Analyseur de Contenu Multimodal",
         description="""
@@ -140,6 +163,7 @@ def create_interface():
         - Texte : enrichit la description
         La sortie combine toutes ces informations en une description cohérente.
         """
     )
@@ -147,4 +171,4 @@ def create_interface():
 if __name__ == "__main__":
     interface = create_interface()
-    interface.launch()

 from PIL import Image
 import os
 import logging
+# Vous devez ajouter ici l'importation de ModelscopeT2V, selon la documentation officielle
+# Exemple fictif :
+# from modelscope import T2V  # Exemple, veuillez l'adapter à la bibliothèque correcte
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
                                            model="openai/whisper-small")
             self.text_generator = pipeline("text-generation",
                                         model="gpt2")
+            # Ajouter ModelscopeT2V ici
+            # self.modelscope_t2v = T2V.from_pretrained("modelscope/t2v-base")
             logger.info("Modèles chargés avec succès")
         except Exception as e:
             logger.error(f"Erreur lors du chargement des modèles: {str(e)}")
             logger.error(f"Erreur lors de la génération de texte: {str(e)}")
             return "Erreur lors de la génération de texte."
+    def generate_video(self, prompt):
+        """Génère une vidéo à partir du texte (prompt) en utilisant ModelscopeT2V"""
+        try:
+            # Utilisation de ModelscopeT2V pour générer une vidéo à partir du texte
+            # Supposons que ModelscopeT2V a une méthode `generate_video_from_text`
+            # video_url = self.modelscope_t2v.generate_video_from_text(prompt)
+            # Code fictif, adaptez-le à l'API réelle de ModelscopeT2V
+            video_url = "URL_fictive_de_la_video_générée"  # Remplacez par le véritable lien
+            return video_url
+        except Exception as e:
+            logger.error(f"Erreur lors de la génération de vidéo: {str(e)}")
+            return "Erreur lors de la génération de la vidéo."
     def process_inputs(self, image, audio, text):
         """Traite les entrées multimodales"""
         try:
             else:
                 final_prompt = "Aucune entrée fournie."
+            # Génération de la vidéo à partir du texte généré
+            video_url = self.generate_video(final_prompt)
+            return final_prompt, video_url
         except Exception as e:
             logger.error(f"Erreur lors du traitement des entrées: {str(e)}")
+            return "Une erreur est survenue lors du traitement des entrées.", None
 def create_interface():
     """Crée l'interface Gradio"""
             gr.Textbox(label="Entrez du texte additionnel")
         ],
         outputs=[
+            gr.Textbox(label="Description générée"),
+            gr.Video(label="Vidéo générée")
         ],
         title="Analyseur de Contenu Multimodal",
         description="""
         - Texte : enrichit la description
         La sortie combine toutes ces informations en une description cohérente.
+        Elle génère également une vidéo basée sur le texte final.
         """
     )
 if __name__ == "__main__":
     interface = create_interface()
+    interface.launch()