Spaces:

KIMOSSINO
/

transcriptionv2

Configuration error

App Files Files Community

KIMOSSINO commited on Dec 7, 2024

Commit

5c8b131

verified ·

1 Parent(s): 777a4e8

Update app.py

Browse files

Files changed (1) hide show

app.py +201 -0

app.py CHANGED Viewed

	@@ -0,0 +1,201 @@

+import gradio as gr
+import whisper
+import os
+import asyncio
+import edge_tts
+from transformers import pipeline
+from deep_translator import GoogleTranslator
+from docx import Document
+import tempfile
+from datetime import datetime
+import logging
+from pydub import AudioSegment
+# إعداد التسجيل
+logging.basicConfig(
+    level=logging.INFO,
+    format="%(asctime)s - %(name)s - %(levelname)s - %(message)s",
+    handlers=[
+        logging.FileHandler("app.log"),
+        logging.StreamHandler(),
+    ],
+)
+logger = logging.getLogger(__name__)
+# قائمة اللغات المدعومة
+SUPPORTED_LANGUAGES = {
+    "ar": "العربية",
+    "en": "English",
+    "fr": "Français",
+    "es": "Español",
+    "de": "Deutsch",
+}
+# تعيين أصوات لكل لغة
+VOICE_MAPPINGS = {
+    "ar": "ar-EG-ShakirNeural",
+    "en": "en-US-EricNeural",
+    "fr": "fr-FR-HenriNeural",
+    "es": "es-ES-AlvaroNeural",
+    "de": "de-DE-ConradNeural",
+}
+# تحديد اللغات RTL
+RTL_LANGUAGES = ["ar"]
+# وظيفة تنظيف النص
+def clean_text(text):
+    return (
+        text.replace("’", "'")
+        .replace("«", "")
+        .replace("»", "")
+        .replace("\n", " ")
+        .strip()
+    )
+# وظيفة توليد الصوت
+async def generate_speech(text, lang):
+    """توليد الصوت باستخدام edge-tts"""
+    try:
+        voice = VOICE_MAPPINGS.get(lang, "en-US-EricNeural")
+        communicate = edge_tts.Communicate(text, voice)
+        audio_path = tempfile.mktemp(suffix=".mp3")
+        await communicate.save(audio_path)
+        if os.path.exists(audio_path) and os.path.getsize(audio_path) > 0:
+            logger.info(f"تم إنشاء ملف صوتي: {audio_path}")
+            return audio_path
+        else:
+            logger.error("فشل إنشاء ملف صوتي صالح")
+            return None
+    except Exception as e:
+        logger.error(f"خطأ في توليد الصوت: {str(e)}")
+        return None
+# تحويل النص إلى صوت
+def text_to_speech(text, lang):
+    if not text:
+        logger.warning("لم يتم تقديم نص للتحويل إلى صوت")
+        return None
+    try:
+        text = clean_text(text)
+        max_length = 1000
+        text_parts = [text[i : i + max_length] for i in range(0, len(text), max_length)]
+        audio_files = []
+        for part in text_parts:
+            audio_path = asyncio.run(generate_speech(part, lang))
+            if audio_path:
+                audio_files.append(audio_path)
+        if len(audio_files) == 1:
+            return audio_files[0]
+        final_audio = AudioSegment.from_mp3(audio_files[0])
+        for audio_file in audio_files[1:]:
+            final_audio += AudioSegment.from_mp3(audio_file)
+        final_path = tempfile.mktemp(suffix=".mp3")
+        final_audio.export(final_path, format="mp3")
+        for file in audio_files:
+            os.remove(file)
+        return final_path
+    except Exception as e:
+        logger.error(f"خطأ في تحويل النص إلى صوت: {str(e)}")
+        return None
+# الترجمة
+def translate_text(text, source_lang, target_lang):
+    if source_lang == target_lang:
+        return text
+    try:
+        translator = GoogleTranslator(source=source_lang, target=target_lang)
+        max_length = 5000
+        text_parts = [text[i : i + max_length] for i in range(0, len(text), max_length)]
+        translated_parts = [translator.translate(part) for part in text_parts]
+        return " ".join(translated_parts)
+    except Exception as e:
+        logger.error(f"خطأ في الترجمة: {str(e)}")
+        return f"خطأ في الترجمة: {str(e)}"
+# معالجة الفيديو
+def process_video(video, source_lang="en", target_lang="ar"):
+    if video is None:
+        return {
+            "error": "الرجاء رفع ملف فيديو",
+            "original": "",
+            "translated": "",
+        }
+    try:
+        temp_path = video.name
+        model = whisper.load_model("base")
+        result = model.transcribe(temp_path, language=source_lang)
+        transcribed_text = result["text"]
+        translated_text = translate_text(transcribed_text, source_lang, target_lang)
+        return {
+            "error": None,
+            "original": transcribed_text,
+            "translated": translated_text,
+        }
+    except Exception as e:
+        logger.error(f"خطأ في معالجة الفيديو: {str(e)}")
+        return {
+            "error": f"حدث خطأ: {str(e)}",
+            "original": "",
+            "translated": "",
+        }
+# إنشاء الواجهة
+def create_ui():
+    with gr.Blocks() as demo:
+        gr.Markdown("# 🎥 تحويل الفيديو إلى نصوص وصوت")
+        with gr.Row():
+            video_input = gr.File(label="📁 رفع فيديو", file_types=["video"])
+            source_lang = gr.Dropdown(
+                choices=list(SUPPORTED_LANGUAGES.keys()),
+                value="en",
+                label="🗣️ لغة الفيديو الأصلية",
+            )
+            target_lang = gr.Dropdown(
+                choices=list(SUPPORTED_LANGUAGES.keys()),
+                value="ar",
+                label="🌐 لغة الترجمة",
+            )
+            process_btn = gr.Button("🎯 معالجة الفيديو")
+        with gr.Tabs():
+            with gr.TabItem("النص الأصلي"):
+                original_text = gr.Textbox(label="النص المستخرج", lines=10)
+                original_audio = gr.Audio(label="الصوت")
+            with gr.TabItem("النص المترجم"):
+                translated_text = gr.Textbox(label="النص المترجم", lines=10)
+                translated_audio = gr.Audio(label="الصوت")
+        def update_ui(video, src_lang, tgt_lang):
+            result = process_video(video, src_lang, tgt_lang)
+            return {
+                original_text: result["original"],
+                translated_text: result["translated"],
+            }
+        process_btn.click(
+            fn=update_ui,
+            inputs=[video_input, source_lang, target_lang],
+            outputs=[original_text, translated_text],
+        )
+    return demo
+if __name__ == "__main__":
+    demo = create_ui()
+    demo.launch()