Spaces:

KIMOSSINO
/

transcriptionv2

Configuration error

App Files Files Community

KIMOSSINO commited on Dec 7, 2024

Commit

a3a1da9

verified ·

1 Parent(s): fef6f4c

Delete app.py

Browse files

Files changed (1) hide show

app.py +0 -244

app.py DELETED Viewed

@@ -1,244 +0,0 @@
-import gradio as gr
-import whisper
-import os
-import moviepy.editor as mp
-from transformers import pipeline, AutoTokenizer, AutoModelForSeq2SeqGeneration
-from tqdm import tqdm
-# تهيئة النماذج
-print("جاري تحميل نموذج Whisper...")
-whisper_model = whisper.load_model("base")
-# قائمة اللغات المدعومة
-SUPPORTED_LANGUAGES = {
-    'ar': 'العربية',
-    'en': 'English',
-    'fr': 'Français',
-    'es': 'Español',
-    'de': 'Deutsch',
-    'it': 'Italiano',
-    'pt': 'Português',
-    'ru': 'Русский',
-    'zh': '中文',
-    'ja': '日本語'
-}
-# تهيئة نماذج الترجمة
-translation_models = {}
-def load_translation_model(source_lang, target_lang):
-    """تحميل نموذج الترجمة عند الحاجة"""
-    key = f'{source_lang}2{target_lang}'
-    if key not in translation_models:
-        model_name = f'Helsinki-NLP/opus-mt-{source_lang}-{target_lang}'
-        try:
-            translation_models[key] = pipeline('translation', model=model_name)
-        except:
-            # إذا لم يتوفر نموذج مباشر، نستخدم الإنجليزية كلغة وسيطة
-            if source_lang != 'en':
-                source_to_en = pipeline('translation',
-                    model=f'Helsinki-NLP/opus-mt-{source_lang}-en')
-                translation_models[f'{source_lang}2en'] = source_to_en
-            if target_lang != 'en':
-                en_to_target = pipeline('translation',
-                    model=f'Helsinki-NLP/opus-mt-en-{target_lang}')
-                translation_models[f'en2{target_lang}'] = en_to_target
-def translate_text(text, source_lang, target_lang):
-    """ترجمة النص مع دعم الترجمة عبر الإنجليزية كلغة وسيطة"""
-    if source_lang == target_lang:
-        return text
-    try:
-        # محاولة الترجمة المباشرة
-        key = f'{source_lang}2{target_lang}'
-        if key not in translation_models:
-            load_translation_model(source_lang, target_lang)
-        if key in translation_models:
-            return translation_models[key](text)[0]['translation_text']
-        # الترجمة عبر الإنجليزية كلغة وسيطة
-        if source_lang != 'en':
-            text = translation_models[f'{source_lang}2en'](text)[0]['translation_text']
-        if target_lang != 'en':
-            text = translation_models[f'en2{target_lang}'](text)[0]['translation_text']
-        return text
-    except Exception as e:
-        return f"خطأ في الترجمة: {str(e)}"
-def process_video(video_path, source_lang, target_lang=None):
-    """معالجة الفيديو واستخراج النص وترجمته"""
-    try:
-        # استخراج الصوت
-        video = mp.VideoFileClip(video_path)
-        audio_path = video_path.rsplit('.', 1)[0] + '.mp3'
-        video.audio.write_audiofile(audio_path, verbose=False)
-        video.close()
-        # استخراج النص
-        print(f"جاري تحويل الصوت إلى نص باللغة {source_lang}...")
-        result = whisper_model.transcribe(audio_path, language=source_lang)
-        # تنظيف
-        os.remove(audio_path)
-        transcribed_text = result["text"]
-        translated_text = None
-        # ترجمة النص
-        if target_lang and target_lang != source_lang:
-            print(f"جاري الترجمة من {source_lang} إلى {target_lang}...")
-            translated_text = translate_text(transcribed_text, source_lang, target_lang)
-        return {
-            "original_text": transcribed_text,
-            "translated_text": translated_text,
-            "segments": result["segments"]
-        }
-    except Exception as e:
-        return {
-            "error": str(e),
-            "original_text": "",
-            "translated_text": "",
-            "segments": []
-        }
-def format_time(seconds):
-    """تنسيق الوقت بشكل مقروء"""
-    hours = int(seconds // 3600)
-    minutes = int((seconds % 3600) // 60)
-    seconds = seconds % 60
-    if hours > 0:
-        return f"{hours:02d}:{minutes:02d}:{seconds:05.2f}"
-    return f"{minutes:02d}:{seconds:05.2f}"
-def create_html_output(result, source_lang, target_lang):
-    """إنشاء مخرجات HTML منسقة"""
-    html = f"""
-    <div style='font-family: Arial, sans-serif; max-width: 800px; margin: 0 auto;'>
-        <div style='background: #f5f5f5; padding: 20px; border-radius: 8px; margin-bottom: 20px;'>
-            <h3 style='color: #2c3e50; margin-top: 0;'>النص الأصلي ({SUPPORTED_LANGUAGES.get(source_lang, source_lang)})</h3>
-            <p style='white-space: pre-wrap; color: #34495e;'>{result['original_text']}</p>
-        </div>
-    """
-    if result.get('translated_text'):
-        html += f"""
-        <div style='background: #f5f5f5; padding: 20px; border-radius: 8px; margin-bottom: 20px;'>
-            <h3 style='color: #2c3e50; margin-top: 0;'>الترجمة ({SUPPORTED_LANGUAGES.get(target_lang, target_lang)})</h3>
-            <p style='white-space: pre-wrap; color: #34495e;'>{result['translated_text']}</p>
-        </div>
-        """
-    html += """
-    <div style='background: #f5f5f5; padding: 20px; border-radius: 8px;'>
-        <h3 style='color: #2c3e50; margin-top: 0;'>النص مع التوقيت</h3>
-        <div style='max-height: 300px; overflow-y: auto;'>
-    """
-    for segment in result['segments']:
-        start_time = format_time(segment['start'])
-        end_time = format_time(segment['end'])
-        html += f"""
-        <div style='margin-bottom: 10px; padding: 10px; background: white; border-radius: 4px;'>
-            <span style='color: #7f8c8d; font-size: 0.9em;'>[{start_time} → {end_time}]</span>
-            <p style='margin: 5px 0 0 0; color: #34495e;'>{segment['text']}</p>
-        </div>
-        """
-    html += """
-        </div>
-    </div>
-    </div>
-    """
-    return html
-def gradio_interface(video, source_lang, target_lang):
-    """واجهة المستخدم الرئيسية"""
-    if video is None:
-        return "الرجاء رفع ملف فيديو"
-    temp_path = "temp_video.mp4"
-    try:
-        with open(temp_path, "wb") as f:
-            f.write(video)
-        result = process_video(temp_path, source_lang, target_lang)
-        if "error" in result:
-            return f"حدث خطأ: {result['error']}"
-        return create_html_output(result, source_lang, target_lang)
-    except Exception as e:
-        return f"حدث خطأ: {str(e)}"
-    finally:
-        if os.path.exists(temp_path):
-            os.remove(temp_path)
-# تكوين الواجهة
-css = """
-.gradio-container {
-    font-family: 'Arial', sans-serif;
-}
-.output-html {
-    max-height: 600px;
-    overflow-y: auto;
-}
-"""
-# إنشاء واجهة Gradio
-interface = gr.Interface(
-    fn=gradio_interface,
-    inputs=[
-        gr.File(
-            label="رفع فيديو",
-            file_types=["video"],
-            type="binary"
-        ),
-        gr.Dropdown(
-            choices=list(SUPPORTED_LANGUAGES.keys()),
-            value="en",
-            label="لغة الفيديو الأصلية",
-            info="اختر لغة الفيديو الأصلية"
-        ),
-        gr.Dropdown(
-            choices=list(SUPPORTED_LANGUAGES.keys()),
-            value="ar",
-            label="لغة الترجمة",
-            info="اختر اللغة التي تريد الترجمة إليها"
-        )
-    ],
-    outputs=gr.HTML(
-        label="النتيجة",
-        elem_classes=["output-html"]
-    ),
-    title="منصة تحويل الفيديو إلى نص مع الترجمة",
-    description="""
-    منصة متقدمة لتحويل الفيديو إلى نص مع دعم الترجمة بين العديد من اللغات.
-    اللغات المدعومة:
-    - العربية (ar)
-    - الإنجليزية (en)
-    - الفرنسية (fr)
-    - الإسبانية (es)
-    - الألمانية (de)
-    - الإيطالية (it)
-    - البرتغالية (pt)
-    - الروسية (ru)
-    - الصينية (zh)
-    - اليابانية (ja)
-    ملاحظات:
-    - الحد الأقصى لحجم الفيديو: 100 ميجابايت
-    - يمكن أن تستغرق المعالجة بضع دقائق حسب طول الفيديو
-    """,
-    css=css,
-    examples=[],
-    cache_examples=False
-)
-# تشغيل التطبيق
-if __name__ == "__main__":
-    interface.launch()