Spaces:

arif670
/

AI_VID

Build error

App Files Files Community

arif670 commited on Mar 29

Commit

16d1003

verified ·

1 Parent(s): edb58da

Update video_generator.py

Browse files

Files changed (1) hide show

video_generator.py +30 -25

video_generator.py CHANGED Viewed

@@ -1,15 +1,13 @@
 import os
 import numpy as np
 from PIL import Image
 from moviepy.editor import ImageSequenceClip, AudioFileClip
 from moviepy.config import change_settings
-import logging
-# Configure logging
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
-# Configure MoviePy
 change_settings({"IMAGEMAGICK_BINARY": "/usr/bin/convert"})
 def generate_video_pipeline(
@@ -22,54 +20,61 @@ def generate_video_pipeline(
     fps: int = 24
 ):
     os.makedirs(output_dir, exist_ok=True)
-    image_path = None  # Initialize variable
     audio_path = None
     try:
-        # Generate initial image
-        logger.info(f"Generating image for prompt: {prompt}")
         image_result = text_to_image_model(prompt)
         image = image_result.images[0]
         image_path = os.path.join(output_dir, "frame.png")
         image.save(image_path)
-        # Generate video frames
-        logger.info(f"Generating {duration}s video @ {fps}fps")
         video_frames = image_to_video_model(
             prompt,
             image=image,
             num_frames=int(duration * fps),
-            num_inference_steps=25
         ).frames
-        # Create video clip
         video_path = os.path.join(output_dir, "output.mp4")
-        clip = ImageSequenceClip([np.array(frame) for frame in video_frames], fps=fps)
-        # Add audio if available
         if tts_model and prompt:
-            logger.info("Generating audio track")
             audio = tts_model.generate(prompt)
             audio_path = os.path.join(output_dir, "audio.wav")
             audio.save(audio_path)
-            audio_clip = AudioFileClip(audio_path)
-            clip = clip.set_audio(audio_clip)
-        # Export final video
-        clip.write_videofile(video_path, codec="libx264", audio_codec="aac", logger=None)
-        logger.info(f"Video generated at {video_path}")
         return video_path
     except Exception as e:
-        logger.error(f"Pipeline error: {str(e)}", exc_info=True)
-        raise RuntimeError(f"Video generation failed: {str(e)}") from e
     finally:
-        # Cleanup temporary files safely
         for path in [image_path, audio_path]:
             if path and os.path.exists(path):
                 try:
                     os.remove(path)
-                    logger.debug(f"Cleaned up temporary file: {path}")
-                except Exception as cleanup_error:
-                    logger.warning(f"Failed to clean {path}: {str(cleanup_error)}")

 import os
 import numpy as np
+import logging
 from PIL import Image
 from moviepy.editor import ImageSequenceClip, AudioFileClip
 from moviepy.config import change_settings
+import torch
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
 change_settings({"IMAGEMAGICK_BINARY": "/usr/bin/convert"})
 def generate_video_pipeline(
     fps: int = 24
 ):
     os.makedirs(output_dir, exist_ok=True)
+    image_path = None
     audio_path = None
     try:
+        # Generate image with device awareness
         image_result = text_to_image_model(prompt)
         image = image_result.images[0]
+        # Convert to CPU-compatible format if needed
+        if image_to_video_model.device.type == "cpu":
+            image = image.float()
         image_path = os.path.join(output_dir, "frame.png")
         image.save(image_path)
+        # Video generation
         video_frames = image_to_video_model(
             prompt,
             image=image,
             num_frames=int(duration * fps),
+            num_inference_steps=25,
+            generator=torch.Generator(
+                device=image_to_video_model.device
+            )
         ).frames
+        # Create video
         video_path = os.path.join(output_dir, "output.mp4")
+        clip = ImageSequenceClip(
+            [np.array(frame) for frame in video_frames],
+            fps=fps
+        )
+        # Audio handling
         if tts_model and prompt:
             audio = tts_model.generate(prompt)
             audio_path = os.path.join(output_dir, "audio.wav")
             audio.save(audio_path)
+            clip = clip.set_audio(AudioFileClip(audio_path))
+        clip.write_videofile(video_path,
+                           codec="libx264",
+                           audio_codec="aac",
+                           logger=None)
         return video_path
     except Exception as e:
+        logger.error(f"Generation failed: {str(e)}")
+        raise
     finally:
+        # Safe cleanup
         for path in [image_path, audio_path]:
             if path and os.path.exists(path):
                 try:
                     os.remove(path)
+                except Exception as e:
+                    logger.warning(f"Cleanup failed: {str(e)}")