whisper

Paused

antfraia commited on Aug 27, 2023

Commit

161393d

1 Parent(s): 2cd9f21

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,34 +1,31 @@
 import gradio as gr
-from transformers import BartTokenizer, BartForConditionalGeneration
-import whisper
-# Initialize the BART model and tokenizer
-MODEL_NAME = "facebook/bart-large-cnn"
-model = BartForConditionalGeneration.from_pretrained(MODEL_NAME)
-tokenizer = BartTokenizer.from_pretrained(MODEL_NAME)
-def convert_and_summarize(audio_path: str) -> str:
-    # Convert audio to text
-    whisper_model = whisper.load_model("base")
-    result = whisper_model.transcribe(audio_path)
-    transcribed_text = result["text"]
-    # Summarize the transcribed text
-    inputs = tokenizer([transcribed_text], max_length=1024, truncation=True, return_tensors='pt')
-    summary_ids = model.generate(inputs['input_ids'])
-    summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
-    return summary
 audio_input = gr.inputs.Audio(type="filepath")
-# Interface for Gradio
 iface = gr.Interface(
-    fn=convert_and_summarize,
     inputs=audio_input,
-    outputs="text",
-    title="Audio-to-Summarized-Text",
-    description="Upload an audio here and get a bullet-point summary of its content.",
     theme="Monochrome",
     live=True,
     capture_session=True,

 import gradio as gr
+import requests
+API_URL = "https://api-inference.huggingface.co/models/openai/whisper-large-v2/whisper"
+API_KEY = "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"
+HEADERS = {"Authorization": f"Bearer {API_KEY}"}
+def transcribe_audio(audio_path: str) -> str:
+    # Read audio file
+    with open(audio_path, "rb") as f:
+        audio_data = f.read()
+    # Make API request to OpenAI Whisper v2 API
+    response = requests.post(API_URL, headers=HEADERS, data=audio_data)
+    result = response.json()
+    transcribed_text = result["text"]
+    return transcribed_text
 audio_input = gr.inputs.Audio(type="filepath")
+text_output = gr.outputs.Textbox()
 iface = gr.Interface(
+    fn=transcribe_audio,
     inputs=audio_input,
+    outputs=text_output,
+    title="Speech-to-Text using Whisper v2",
+    description="Upload an audio file to transcribe it to text.",
     theme="Monochrome",
     live=True,
     capture_session=True,