asr-inference / app.py
ankush13r's picture
add whisper with language tags and prompt
588b387
raw
history blame
1.11 kB
import gradio as gr
from whisper2 import generate
MODEL_NAME = "/whisper-large-v3"
def transcribe(inputs):
if inputs is None:
raise gr.Error("Cap fitxer d'脿udio introduit! Si us plau pengeu un fitxer "\
"o enregistreu un 脿udio abans d'enviar la vostra sol路licitud")
return generate(audio=inputs)
description_string = "Transcripci贸 autom脿tica de micr貌fon o de fitxers d'脿udio.\n Aquest demostrador s'ha desenvolupat per"\
" comprovar els models de reconeixement de parla per a m贸bils. Per ara utilitza el checkpoint "\
f"[{MODEL_NAME}](https://huggingface.co/{MODEL_NAME}) i la llibreria de 馃 Transformers per a la transcripci贸."
file_transcribe = gr.Interface(
fn=transcribe,
inputs=[
gr.Audio(sources=["upload", "microphone"], type="filepath", label="Audio")
],
outputs="text",
title="Transcripci贸 autom脿tica d'脿udio",
description=(description_string),
allow_flagging="never",
)
demo = gr.TabbedInterface([file_transcribe], ["Fitxer"])
if __name__ == "__main__":
demo.launch()