mainmainmina / app.py
Uniaff's picture
Update app.py
49487f1 verified
raw
history blame
4.36 kB
import gradio as gr
import subprocess
import os
import tempfile
def generate(video, audio, checkpoint, no_smooth, resize_factor, pad_top, pad_bottom, pad_left, pad_right):
if video is None or audio is None or checkpoint is None:
return "Пожалуйста, загрузите видео/изображение и аудио файл, а также выберите чекпойнт."
# Поскольку Gradio возвращает пути к файлам, используем их напрямую
video_path = video # Уже строка с путем к видео
audio_path = audio # Уже строка с путем к аудио
# Логирование путей для отладки
print(f"Video path: {video_path}, Audio path: {audio_path}")
# Создание временной директории для сохранения выходного видео
with tempfile.TemporaryDirectory() as temp_dir:
# Определение выходного файла
output_path = os.path.join(temp_dir, "output.mp4")
print(f"Output path: {output_path}")
# Подготовка аргументов для инференса
args = [
"--checkpoint_path", f"checkpoints/{checkpoint}.pth",
"--segmentation_path", "checkpoints/face_segmentation.pth",
"--enhance_face", "gfpgan",
"--face", video_path,
"--audio", audio_path,
"--outfile", output_path,
"--resize_factor", str(resize_factor),
"--pads", str(pad_top), str(pad_bottom), str(pad_left), str(pad_right)
]
if no_smooth:
args.append("--nosmooth")
try:
# Вызов команды инференса
cmd = ["python", "inference.py"] + args
print(f"Running inference with command: {' '.join(cmd)}")
subprocess.run(cmd, check=True)
except subprocess.CalledProcessError as e:
print(f"Command failed with error: {e}")
return f"Произошла ошибка при обработке: {e}"
# Проверка наличия выходного файла
if not os.path.exists(output_path):
print("Output file does not exist.")
return "Не удалось создать выходное видео."
# Возвращаем путь к выходному файлу
print(f"Output file created at: {output_path}")
return output_path # Gradio автоматически обработает путь и выведет видео
with gr.Blocks() as ui:
gr.Markdown("## Wav2Lip - Синхронизация губ в видео")
with gr.Row():
video = gr.File(label="Видео или Изображение", type="filepath")
audio = gr.File(label="Аудио", type="filepath")
with gr.Column():
checkpoint = gr.Radio(["wav2lip", "wav2lip_gan"], label="Чекпойнт", value="wav2lip_gan")
no_smooth = gr.Checkbox(label="Без сглаживания", value=False)
resize_factor = gr.Slider(minimum=1, maximum=4, step=1, label="Фактор изменения размера", value=1)
with gr.Row():
with gr.Column():
pad_top = gr.Slider(minimum=0, maximum=50, step=1, value=0, label="Отступ сверху")
pad_bottom = gr.Slider(minimum=0, maximum=50, step=1, value=10, label="Отступ снизу (рекомендуется 20 для включения подбородка)")
pad_left = gr.Slider(minimum=0, maximum=50, step=1, value=0, label="Отступ слева")
pad_right = gr.Slider(minimum=0, maximum=50, step=1, value=0, label="Отступ справа")
generate_btn = gr.Button("Сгенерировать")
with gr.Column():
result = gr.Video(label="Результат")
generate_btn.click(
generate,
inputs=[video, audio, checkpoint, no_smooth, resize_factor, pad_top, pad_bottom, pad_left, pad_right],
outputs=result,
concurrency_limit=1 # Устанавливаем лимит на количество одновременно выполняемых операций
)
ui.launch(debug=True)