mainmainminavoiceclone

Running

App Files Files Community

Uniaff commited on Sep 15, 2024

Commit

d627392

verified ·

1 Parent(s): fe68bd3

Update app.py

Browse files

Files changed (1) hide show

app.py +75 -37

app.py CHANGED Viewed

@@ -1,49 +1,87 @@
 import gradio as gr
 import subprocess
-from subprocess import call
 with gr.Blocks() as ui:
     with gr.Row():
-        video = gr.File(label="Video or Image")
-        audio = gr.File(label="Audio")
         with gr.Column():
-            checkpoint = gr.Radio(["wav2lip", "wav2lip_gan"], label="Checkpoint")
-            no_smooth = gr.Checkbox(label="No Smooth")
-            resize_factor = gr.Slider(minimum=1, maximum=4, step=1, label="Resize Factor")
     with gr.Row():
         with gr.Column():
-            pad_top = gr.Slider(minimum=0, maximum=50, step=1, value=0, label="Pad Top")
-            pad_bottom = gr.Slider(minimum=0, maximum=50, step=1, value=10, label="Pad Bottom (Often increasing this to 20 allows chin to be included)")
-            pad_left = gr.Slider(minimum=0, maximum=50, step=1, value=0, label="Pad Left")
-            pad_right = gr.Slider(minimum=0, maximum=50, step=1, value=0, label="Pad Right")
-            generate_btn = gr.Button("Generate")
         with gr.Column():
-           result = gr.Video()
-    def generate(video, audio, checkpoint, no_smooth, resize_factor, pad_top, pad_bottom, pad_left, pad_right):
-        if video is None or audio is None or checkpoint is None:
-            return
-        smooth = "--nosmooth" if no_smooth else ""
-        cmd = [
-            "python",
-            "inference.py",
-            "--checkpoint_path", f"checkpoints/{checkpoint}.pth",
-            "--segmentation_path", "checkpoints/face_segmentation.pth",
-            "--enhance_face", "gfpgan",
-            "--face", video.name,
-            "--audio", audio.name,
-            "--outfile", "results/output.mp4",
-        ]
-        call(cmd)
-        return "results/output.mp4"
     generate_btn.click(
         generate,
-        [video, audio, checkpoint, pad_top, pad_bottom, pad_left, pad_right, resize_factor],
-        result)
-ui.queue().launch(debug=True)

 import gradio as gr
+import torch
+import os
 import subprocess
+import tempfile
+from inference import main as inference_main  # Предполагается, что вы интегрируете функцию main из inference.py
+import shutil
+def generate(video, audio, checkpoint, no_smooth, resize_factor, pad_top, pad_bottom, pad_left, pad_right):
+    if video is None or audio is None or checkpoint is None:
+        return "Пожалуйста, загрузите видео/изображение и аудио файл, а также выберите чекпойнт."
+    # Создание временной директории для обработки
+    with tempfile.TemporaryDirectory() as temp_dir:
+        # Копирование загруженных файлов во временную директорию
+        video_path = os.path.join(temp_dir, video.name)
+        audio_path = os.path.join(temp_dir, audio.name)
+        with open(video_path, "wb") as f:
+            f.write(video.read())
+        with open(audio_path, "wb") as f:
+            f.write(audio.read())
+        # Определение выходного файла
+        output_path = os.path.join(temp_dir, "output.mp4")
+        # Подготовка аргументов для inference.py
+        args = [
+            "--checkpoint_path", f"checkpoints/{checkpoint}.pth",
+            "--segmentation_path", "checkpoints/face_segmentation.pth",
+            "--enhance_face", "gfpgan",
+            "--face", video_path,
+            "--audio", audio_path,
+            "--outfile", output_path,
+            "--resize_factor", str(resize_factor),
+            "--pads", str(pad_top), str(pad_bottom), str(pad_left), str(pad_right)
+        ]
+        if no_smooth:
+            args.append("--nosmooth")
+        try:
+            # Вызов функции инференса напрямую
+            # Если вы интегрируете код из inference.py, вызовите функцию непосредственно
+            # Например:
+            # inference_main(args)
+            # Но для простоты, здесь мы будем использовать subprocess
+            cmd = ["python", "inference.py"] + args
+            subprocess.run(cmd, check=True)
+        except subprocess.CalledProcessError as e:
+            return f"Произошла ошибка при обработке: {e}"
+        # Проверка наличия выходного файла
+        if not os.path.exists(output_path):
+            return "Не удалось создать выходное видео."
+        # Чтение выходного файла
+        with open(output_path, "rb") as f:
+            output_video = f.read()
+        return output_video
 with gr.Blocks() as ui:
+    gr.Markdown("## Wav2Lip - Синхронизация губ в видео")
     with gr.Row():
+        video = gr.File(label="Видео или Изображение", type="file")
+        audio = gr.File(label="Аудио", type="file")
         with gr.Column():
+            checkpoint = gr.Radio(["wav2lip", "wav2lip_gan"], label="Чекпойнт", value="wav2lip_gan")
+            no_smooth = gr.Checkbox(label="Без сглаживания", value=False)
+            resize_factor = gr.Slider(minimum=1, maximum=4, step=1, label="Фактор изменения размера", value=1)
     with gr.Row():
         with gr.Column():
+            pad_top = gr.Slider(minimum=0, maximum=50, step=1, value=0, label="Отступ сверху")
+            pad_bottom = gr.Slider(minimum=0, maximum=50, step=1, value=10, label="Отступ снизу (рекомендуется 20 для включения подбородка)")
+            pad_left = gr.Slider(minimum=0, maximum=50, step=1, value=0, label="Отступ слева")
+            pad_right = gr.Slider(minimum=0, maximum=50, step=1, value=0, label="Отступ справа")
+            generate_btn = gr.Button("Сгенерировать")
         with gr.Column():
+            result = gr.Video(label="Результат")
     generate_btn.click(
         generate,
+        inputs=[video, audio, checkpoint, no_smooth, resize_factor, pad_top, pad_bottom, pad_left, pad_right],
+        outputs=result
+    )
+ui.queue(concurrency_count=1).launch(debug=True)