Spaces:

KIMOSSINO
/

multilingual

Sleeping

App Files Files Community

KIMOSSINO commited on Dec 7, 2024

Commit

c578c49

verified ·

1 Parent(s): f5001e3

Update app.py

Browse files

Files changed (1) hide show

app.py +14 -19

app.py CHANGED Viewed

@@ -13,39 +13,34 @@ vocoder = SpeechT5HifiGan.from_pretrained("microsoft/speecht5_hifigan")
 LANGUAGES = {"English": "en", "French": "fr", "Spanish": "es"}
 def generate_speaker_embedding(speaker_type):
-    """
-    توليد تعبيرات الصوت بناءً على نوع الصوت (ذكر أو أنثى).
-    """
     base_embedding = torch.randn(1, 512)
     if speaker_type == "Female":
         return base_embedding * 0.8
     return base_embedding * 1.2
-def adjust_speed(audio, speed, sampling_rate=24000):
-    """
-    تعديل سرعة الصوت باستخدام مكتبة librosa.
-    """
     return librosa.effects.time_stretch(audio, speed)
 def text_to_speech(text, language, speaker_type, speed):
-    """
-    تحويل النص إلى صوت.
-    """
     try:
         # توليد تعبيرات الصوت بناءً على نوع المتحدث
         speaker_embeddings = generate_speaker_embedding(speaker_type)
         # معالجة النص
         inputs = processor(text=text, return_tensors="pt")
         # توليد الصوت
-        generated_speech = model.generate_speech(
-            inputs["input_ids"],
-            speaker_embeddings,
-            vocoder=vocoder
-        ).cpu().numpy()
-        # تعديل سرعة الصوت
         adjusted_speech = adjust_speed(generated_speech, speed)
         # حفظ الصوت كملف WAV
@@ -90,4 +85,4 @@ def create_interface():
 # تشغيل التطبيق
 demo = create_interface()
-demo.launch()

 LANGUAGES = {"English": "en", "French": "fr", "Spanish": "es"}
 def generate_speaker_embedding(speaker_type):
+    """توليد تعبيرات الصوت بناءً على نوع الصوت (ذكر أو أنثى)."""
     base_embedding = torch.randn(1, 512)
     if speaker_type == "Female":
         return base_embedding * 0.8
     return base_embedding * 1.2
+def adjust_speed(audio, speed):
+    """تعديل سرعة الصوت باستخدام مكتبة librosa."""
     return librosa.effects.time_stretch(audio, speed)
 def text_to_speech(text, language, speaker_type, speed):
+    """تحويل النص إلى صوت."""
     try:
         # توليد تعبيرات الصوت بناءً على نوع المتحدث
         speaker_embeddings = generate_speaker_embedding(speaker_type)
         # معالجة النص
         inputs = processor(text=text, return_tensors="pt")
         # توليد الصوت
+        with torch.no_grad():  # تحسين إدارة الموارد
+            generated_speech = model.generate_speech(
+                inputs["input_ids"],
+                speaker_embeddings,
+                vocoder=vocoder
+            ).cpu().numpy()
+        # ضبط سرعة الصوت
         adjusted_speech = adjust_speed(generated_speech, speed)
         # حفظ الصوت كملف WAV
 # تشغيل التطبيق
 demo = create_interface()
+demo.launch(server_name="0.0.0.0", timeout=180)