Spaces:

KIMOSSINO
/

transcriptionv2

Configuration error

App Files Files Community

KIMOSSINO commited on Dec 7, 2024

Commit

de3e3a5

verified ·

1 Parent(s): 1efaf54

Create app.py

Browse files

Files changed (1) hide show

app.py +244 -0

app.py ADDED Viewed

	@@ -0,0 +1,244 @@

+import gradio as gr
+import whisper
+import os
+import moviepy.editor as mp
+from transformers import pipeline, AutoTokenizer, AutoModelForSeq2SeqGeneration
+from tqdm import tqdm
+# تهيئة النماذج
+print("جاري تحميل نموذج Whisper...")
+whisper_model = whisper.load_model("base")
+# قائمة اللغات المدعومة
+SUPPORTED_LANGUAGES = {
+    'ar': 'العربية',
+    'en': 'English',
+    'fr': 'Français',
+    'es': 'Español',
+    'de': 'Deutsch',
+    'it': 'Italiano',
+    'pt': 'Português',
+    'ru': 'Русский',
+    'zh': '中文',
+    'ja': '日本語'
+}
+# تهيئة نماذج الترجمة
+translation_models = {}
+def load_translation_model(source_lang, target_lang):
+    """تحميل نموذج الترجمة عند الحاجة"""
+    key = f'{source_lang}2{target_lang}'
+    if key not in translation_models:
+        model_name = f'Helsinki-NLP/opus-mt-{source_lang}-{target_lang}'
+        try:
+            translation_models[key] = pipeline('translation', model=model_name)
+        except:
+            # إذا لم يتوفر نموذج مباشر، نستخدم الإنجليزية كلغة وسيطة
+            if source_lang != 'en':
+                source_to_en = pipeline('translation',
+                    model=f'Helsinki-NLP/opus-mt-{source_lang}-en')
+                translation_models[f'{source_lang}2en'] = source_to_en
+            if target_lang != 'en':
+                en_to_target = pipeline('translation',
+                    model=f'Helsinki-NLP/opus-mt-en-{target_lang}')
+                translation_models[f'en2{target_lang}'] = en_to_target
+def translate_text(text, source_lang, target_lang):
+    """ترجمة النص مع دعم الترجمة عبر الإنجليزية كلغة وسيطة"""
+    if source_lang == target_lang:
+        return text
+    try:
+        # محاولة الترجمة المباشرة
+        key = f'{source_lang}2{target_lang}'
+        if key not in translation_models:
+            load_translation_model(source_lang, target_lang)
+        if key in translation_models:
+            return translation_models[key](text)[0]['translation_text']
+        # الترجمة عبر الإنجليزية كلغة وسيطة
+        if source_lang != 'en':
+            text = translation_models[f'{source_lang}2en'](text)[0]['translation_text']
+        if target_lang != 'en':
+            text = translation_models[f'en2{target_lang}'](text)[0]['translation_text']
+        return text
+    except Exception as e:
+        return f"خطأ في الترجمة: {str(e)}"
+def process_video(video_path, source_lang, target_lang=None):
+    """معالجة الفيديو واستخراج النص وترجمته"""
+    try:
+        # استخراج الصوت
+        video = mp.VideoFileClip(video_path)
+        audio_path = video_path.rsplit('.', 1)[0] + '.mp3'
+        video.audio.write_audiofile(audio_path, verbose=False)
+        video.close()
+        # استخراج النص
+        print(f"جاري تحويل الصوت إلى نص باللغة {source_lang}...")
+        result = whisper_model.transcribe(audio_path, language=source_lang)
+        # تنظيف
+        os.remove(audio_path)
+        transcribed_text = result["text"]
+        translated_text = None
+        # ترجمة النص
+        if target_lang and target_lang != source_lang:
+            print(f"جاري الترجمة من {source_lang} إلى {target_lang}...")
+            translated_text = translate_text(transcribed_text, source_lang, target_lang)
+        return {
+            "original_text": transcribed_text,
+            "translated_text": translated_text,
+            "segments": result["segments"]
+        }
+    except Exception as e:
+        return {
+            "error": str(e),
+            "original_text": "",
+            "translated_text": "",
+            "segments": []
+        }
+def format_time(seconds):
+    """تنسيق الوقت بشكل مقروء"""
+    hours = int(seconds // 3600)
+    minutes = int((seconds % 3600) // 60)
+    seconds = seconds % 60
+    if hours > 0:
+        return f"{hours:02d}:{minutes:02d}:{seconds:05.2f}"
+    return f"{minutes:02d}:{seconds:05.2f}"
+def create_html_output(result, source_lang, target_lang):
+    """إنشاء مخرجات HTML منسقة"""
+    html = f"""
+    <div style='font-family: Arial, sans-serif; max-width: 800px; margin: 0 auto;'>
+        <div style='background: #f5f5f5; padding: 20px; border-radius: 8px; margin-bottom: 20px;'>
+            <h3 style='color: #2c3e50; margin-top: 0;'>النص الأصلي ({SUPPORTED_LANGUAGES.get(source_lang, source_lang)})</h3>
+            <p style='white-space: pre-wrap; color: #34495e;'>{result['original_text']}</p>
+        </div>
+    """
+    if result.get('translated_text'):
+        html += f"""
+        <div style='background: #f5f5f5; padding: 20px; border-radius: 8px; margin-bottom: 20px;'>
+            <h3 style='color: #2c3e50; margin-top: 0;'>الترجمة ({SUPPORTED_LANGUAGES.get(target_lang, target_lang)})</h3>
+            <p style='white-space: pre-wrap; color: #34495e;'>{result['translated_text']}</p>
+        </div>
+        """
+    html += """
+    <div style='background: #f5f5f5; padding: 20px; border-radius: 8px;'>
+        <h3 style='color: #2c3e50; margin-top: 0;'>النص مع التوقيت</h3>
+        <div style='max-height: 300px; overflow-y: auto;'>
+    """
+    for segment in result['segments']:
+        start_time = format_time(segment['start'])
+        end_time = format_time(segment['end'])
+        html += f"""
+        <div style='margin-bottom: 10px; padding: 10px; background: white; border-radius: 4px;'>
+            <span style='color: #7f8c8d; font-size: 0.9em;'>[{start_time} → {end_time}]</span>
+            <p style='margin: 5px 0 0 0; color: #34495e;'>{segment['text']}</p>
+        </div>
+        """
+    html += """
+        </div>
+    </div>
+    </div>
+    """
+    return html
+def gradio_interface(video, source_lang, target_lang):
+    """واجهة المستخدم الرئيسية"""
+    if video is None:
+        return "الرجاء رفع ملف فيديو"
+    temp_path = "temp_video.mp4"
+    try:
+        with open(temp_path, "wb") as f:
+            f.write(video)
+        result = process_video(temp_path, source_lang, target_lang)
+        if "error" in result:
+            return f"حدث خطأ: {result['error']}"
+        return create_html_output(result, source_lang, target_lang)
+    except Exception as e:
+        return f"حدث خطأ: {str(e)}"
+    finally:
+        if os.path.exists(temp_path):
+            os.remove(temp_path)
+# تكوين الواجهة
+css = """
+.gradio-container {
+    font-family: 'Arial', sans-serif;
+}
+.output-html {
+    max-height: 600px;
+    overflow-y: auto;
+}
+"""
+# إنشاء واجهة Gradio
+interface = gr.Interface(
+    fn=gradio_interface,
+    inputs=[
+        gr.File(
+            label="رفع فيديو",
+            file_types=["video"],
+            type="binary"
+        ),
+        gr.Dropdown(
+            choices=list(SUPPORTED_LANGUAGES.keys()),
+            value="en",
+            label="لغة الفيديو الأصلية",
+            info="اختر لغة الفيديو الأصلية"
+        ),
+        gr.Dropdown(
+            choices=list(SUPPORTED_LANGUAGES.keys()),
+            value="ar",
+            label="لغة الترجمة",
+            info="اختر اللغة التي تريد الترجمة إليها"
+        )
+    ],
+    outputs=gr.HTML(
+        label="النتيجة",
+        elem_classes=["output-html"]
+    ),
+    title="منصة تحويل الفيديو إلى نص مع الترجمة",
+    description="""
+    منصة متقدمة لتحويل الفيديو إلى نص مع دعم الترجمة بين العديد من اللغات.
+    اللغات المدعومة:
+    - العربية (ar)
+    - الإنجليزية (en)
+    - الفرنسية (fr)
+    - الإسبانية (es)
+    - الألمانية (de)
+    - الإيطالية (it)
+    - البرتغالية (pt)
+    - الروسية (ru)
+    - الصينية (zh)
+    - اليابانية (ja)
+    ملاحظات:
+    - الحد الأقصى لحجم الفيديو: 100 ميجابايت
+    - يمكن أن تستغرق المعالجة بضع دقائق حسب طول الفيديو
+    """,
+    css=css,
+    examples=[],
+    cache_examples=False
+)
+# تشغيل التطبيق
+if __name__ == "__main__":
+    interface.launch()