Spaces:

RXTIME
/

Conversordevideo

Configuration error

App Files Files Community

RXTIME commited on Feb 4

Commit

df07d48

verified ·

1 Parent(s): 5dace72

Update app.py

Browse files

Files changed (1) hide show

app.py +56 -28

app.py CHANGED Viewed

@@ -18,50 +18,78 @@ tokenizer = MarianTokenizer.from_pretrained(HF_MODEL)
 # Função para transcrever áudio
 def transcribe_audio(video_path: str) -> str:
-    result = whisper_model.transcribe(video_path)
-    return result["text"]
 # Função para traduzir texto
 def translate_text(text: str, target_lang="pt") -> str:
-    inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True)
-    translated_tokens = translator.generate(**inputs)
-    return tokenizer.decode(translated_tokens[0], skip_special_tokens=True)
 # Função para gerar áudio em português (usando ElevenLabs)
 def synthesize_speech(text: str, voice="Antônio") -> str:
-    url = "https://api.elevenlabs.io/v1/text-to-speech"
-    headers = {"Authorization": f"Bearer {ELEVENLABS_API_KEY}"}
-    response = requests.post(url, json={"text": text, "voice": voice}, headers=headers)
-    temp_audio = tempfile.NamedTemporaryFile(delete=False, suffix=".mp3")
-    with open(temp_audio.name, "wb") as f:
-        f.write(response.content)
-    return temp_audio.name
 # Função para substituir o áudio no vídeo
 def replace_audio(video_path: str, new_audio_path: str) -> str:
-    output_path = video_path.replace(".mp4", "_translated.mp4")
-    ffmpeg.input(video_path).output(
-        output_path,
-        audio=new_audio_path,
-        codec="copy"
-    ).run(overwrite_output=True)
-    return output_path
 # Pipeline completo
 def process_video(video_file):
-    with tempfile.NamedTemporaryFile(delete=False, suffix=".mp4") as temp_video:
-        temp_video.write(video_file.read())
-        video_path = temp_video.name
-    transcript = transcribe_audio(video_path)
-    translated_text = translate_text(transcript)
-    new_audio_path = synthesize_speech(translated_text)
-    output_video_path = replace_audio(video_path, new_audio_path)
-    return output_video_path
 # Interface Gradio
 iface = gr.Interface(

 # Função para transcrever áudio
 def transcribe_audio(video_path: str) -> str:
+    try:
+        result = whisper_model.transcribe(video_path)
+        return result["text"]
+    except Exception as e:
+        return f"Erro na transcrição: {str(e)}"
 # Função para traduzir texto
 def translate_text(text: str, target_lang="pt") -> str:
+    try:
+        inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True)
+        translated_tokens = translator.generate(**inputs)
+        return tokenizer.decode(translated_tokens[0], skip_special_tokens=True)
+    except Exception as e:
+        return f"Erro na tradução: {str(e)}"
 # Função para gerar áudio em português (usando ElevenLabs)
 def synthesize_speech(text: str, voice="Antônio") -> str:
+    try:
+        url = "https://api.elevenlabs.io/v1/text-to-speech"
+        headers = {"Authorization": f"Bearer {ELEVENLABS_API_KEY}"}
+        response = requests.post(url, json={"text": text, "voice": voice}, headers=headers)
+        if response.status_code != 200:
+            return f"Erro na geração de voz: {response.text}"
+        temp_audio = tempfile.NamedTemporaryFile(delete=False, suffix=".mp3")
+        with open(temp_audio.name, "wb") as f:
+            f.write(response.content)
+        return temp_audio.name
+    except Exception as e:
+        return f"Erro na síntese de voz: {str(e)}"
 # Função para substituir o áudio no vídeo
 def replace_audio(video_path: str, new_audio_path: str) -> str:
+    try:
+        output_path = tempfile.NamedTemporaryFile(delete=False, suffix=".mp4").name
+        ffmpeg.input(video_path).output(
+            output_path,
+            audio=new_audio_path,
+            codec="copy"
+        ).run(overwrite_output=True)
+        return output_path
+    except Exception as e:
+        return f"Erro na substituição do áudio: {str(e)}"
 # Pipeline completo
 def process_video(video_file):
+    try:
+        with tempfile.NamedTemporaryFile(delete=False, suffix=".mp4") as temp_video:
+            temp_video.write(video_file.read())
+            video_path = temp_video.name
+        transcript = transcribe_audio(video_path)
+        if "Erro" in transcript:
+            return transcript
+        translated_text = translate_text(transcript)
+        if "Erro" in translated_text:
+            return translated_text
+        new_audio_path = synthesize_speech(translated_text)
+        if "Erro" in new_audio_path:
+            return new_audio_path
+        output_video_path = replace_audio(video_path, new_audio_path)
+        if "Erro" in output_video_path:
+            return output_video_path
+        return output_video_path
+    except Exception as e:
+        return f"Erro inesperado: {str(e)}"
 # Interface Gradio
 iface = gr.Interface(