Spaces:

Futuresony
/

Automatic-speech-recognition

Sleeping

Futuresony commited on Feb 8

Commit

f4cd8f2

verified ·

1 Parent(s): 3fc3ef4

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,32 +1,9 @@
-# Import necessary modules
 import gradio as gr
-from transformers import pipeline
-# Load the fine-tuned model from Hugging Face
-pipe = pipeline("automatic-speech-recognition", model="Futuresony/whisper-small-sw")
-# Function to transcribe audio
 def transcribe(audio):
-    if audio is None:
-        return "Please upload or record an audio file."
-    print("Transcribing audio...")
-    result = pipe(audio)["text"]
-    return result
-# Gradio App
-with gr.Blocks() as demo:
-    gr.Markdown("# 🎙️ Swahili Speech-to-Text Transcription App")
-    with gr.Row():
-        audio_input = gr.Audio(source="microphone", type="filepath", label="🎤 Record Audio")
-        file_input = gr.Audio(source="upload", type="filepath", label="📂 Upload Audio File")
-    transcribe_button = gr.Button("Transcribe")
-    output_text = gr.Textbox(label="📝 Transcription Output")
-    transcribe_button.click(transcribe, inputs=[audio_input], outputs=output_text)
-    transcribe_button.click(transcribe, inputs=[file_input], outputs=output_text)
-# Launch the app
-demo.launch()

 import gradio as gr
+whisper = gr.load("Futuresony/whisper-small-sw")
 def transcribe(audio):
+    return whisper(audio).replace("AutomaticSpeechRecognitionOutput(text=' ", "").replace("', chunks=None)", "")
+gr.Interface(transcribe, gr.Audio(type="filepath"), gr.Textbox()).launch()