Spaces:

nairaxo
/

swauti

Runtime error

App Files Files Community

nairaxo commited on Jan 6

Commit

8db5cd4

verified ·

1 Parent(s): aa477ef

Update app.py

Browse files

Files changed (1) hide show

app.py +25 -9

app.py CHANGED Viewed

@@ -4,6 +4,8 @@ import scipy
 import torchaudio
 from speechbrain.pretrained import SepformerSeparation as separator
 from shialifube import transliterate
 # Chargement des modèles Whisper pour la transcription
 model_roman = pipeline("automatic-speech-recognition", model="nairaxo/whisper-shikomori-latin")
@@ -37,24 +39,33 @@ def transcribe(audio, model_choice):
 # Fonction de génération et d'amélioration audio
 def generate_and_enhance_audio(text, script_choice):
     try:
         # Translittérer le texte si l'utilisateur a choisi l'arabe
         if script_choice == "Alphabet arabe":
             text = transliterate(text)  # Translittération de l'arabe en latin
         # Synthétiser la parole (audio original)
         speech = synthesiser(text)
-        original_output = "original_output.wav"
-        scipy.io.wavfile.write(original_output, rate=speech["sampling_rate"], data=speech["audio"][0])
-        # Améliorer la qualité audio (audio amélioré)
-        enhanced_output = "enhanced_output.wav"
-        est_sources = model_enh.separate_file(path=original_output)
-        torchaudio.save(enhanced_output, est_sources[:, :, 0].detach().cpu(), 16000)
-        return original_output, enhanced_output
     except Exception as e:
-        return f"Erreur lors de la génération ou de l'amélioration de l'audio : {str(e)}"
 # Interface pour la transcription via microphone
 with gr.Blocks() as mf_transcribe:
@@ -88,8 +99,13 @@ with gr.Blocks() as tts_interface:
     with gr.Row():
         original_audio = gr.Audio(label="Audio original", type="filepath")
         enhanced_audio = gr.Audio(label="Audio amélioré", type="filepath")
     generate_button = gr.Button("Générer l'audio")
-    generate_button.click(fn=generate_and_enhance_audio, inputs=[text_input, script_choice], outputs=[original_audio, enhanced_audio])
 # Interface principale avec onglets
 with gr.Blocks() as demo:

 import torchaudio
 from speechbrain.pretrained import SepformerSeparation as separator
 from shialifube import transliterate
+import tempfile
+import os
 # Chargement des modèles Whisper pour la transcription
 model_roman = pipeline("automatic-speech-recognition", model="nairaxo/whisper-shikomori-latin")
 # Fonction de génération et d'amélioration audio
 def generate_and_enhance_audio(text, script_choice):
     try:
+        # Vérifier si le texte est vide
+        if not text.strip():
+            return None, None, "Erreur : Le texte d'entrée est vide."
         # Translittérer le texte si l'utilisateur a choisi l'arabe
         if script_choice == "Alphabet arabe":
             text = transliterate(text)  # Translittération de l'arabe en latin
         # Synthétiser la parole (audio original)
         speech = synthesiser(text)
+        sampling_rate = speech["sampling_rate"]
+        # Créer des fichiers temporaires pour l'audio original et amélioré
+        with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as original_file:
+            original_output = original_file.name
+            scipy.io.wavfile.write(original_output, rate=sampling_rate, data=speech["audio"][0])
+        with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as enhanced_file:
+            enhanced_output = enhanced_file.name
+            est_sources = model_enh.separate_file(path=original_output)
+            torchaudio.save(enhanced_output, est_sources[:, :, 0].detach().cpu(), sampling_rate)
+        # Retourner les fichiers audio au format attendu par Gradio
+        return (original_output, sampling_rate), (enhanced_output, sampling_rate), None
     except Exception as e:
+        return None, None, f"Erreur lors de la génération ou de l'amélioration de l'audio : {str(e)}"
 # Interface pour la transcription via microphone
 with gr.Blocks() as mf_transcribe:
     with gr.Row():
         original_audio = gr.Audio(label="Audio original", type="filepath")
         enhanced_audio = gr.Audio(label="Audio amélioré", type="filepath")
+    error_output = gr.Textbox(label="Erreur", visible=False)
     generate_button = gr.Button("Générer l'audio")
+    generate_button.click(
+        fn=generate_and_enhance_audio,
+        inputs=[text_input, script_choice],
+        outputs=[original_audio, enhanced_audio, error_output]
+    )
 # Interface principale avec onglets
 with gr.Blocks() as demo: