Spaces:

jiuuee
/

my-alexa

Runtime error

jiuuee commited on May 3, 2024

Commit

927a24e

verified ·

1 Parent(s): 6160888

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -23,6 +23,8 @@ asr_model.change_decoding_strategy(None)
 decoding_cfg = asr_model.cfg.decoding
 decoding_cfg.beam.beam_size = 1
 asr_model.change_decoding_strategy(decoding_cfg)
 feature_stride = asr_model.cfg.preprocessor['window_stride']
 model_stride_in_secs = feature_stride * 8
 frame_asr = FrameBatchMultiTaskAED(
@@ -130,6 +132,6 @@ gr.Interface(
         gr.Textbox(label="Generated Text"),
         gr.Audio(type="filepath", label="Generated Speech")
     ],
-    title="ASR to LLM to TTS",
-    description="Transcribe audio with ASR, generate text with LLM, and convert it back to speech with TTS."
 ).launch(inbrowser=True)

 decoding_cfg = asr_model.cfg.decoding
 decoding_cfg.beam.beam_size = 1
 asr_model.change_decoding_strategy(decoding_cfg)
+asr_model.cfg.preprocessor.dither = 0.0
+asr_model.cfg.preprocessor.pad_to = 0
 feature_stride = asr_model.cfg.preprocessor['window_stride']
 model_stride_in_secs = feature_stride * 8
 frame_asr = FrameBatchMultiTaskAED(
         gr.Textbox(label="Generated Text"),
         gr.Audio(type="filepath", label="Generated Speech")
     ],
+    title="YOUR AWESOME AI ASSISTANT",
+    description="Gets input audio from user, transcribe it with ASR Canary1b, generate text with Phi3LLM, and convert it back to speech with VITS TTS."
 ).launch(inbrowser=True)