Spaces:

gaur3009
/

Idx

Sleeping

gaur3009 commited on Dec 8, 2024

Commit

7971622

verified ·

1 Parent(s): 6f1bd97

Create app.py

Files changed (1) hide show

app.py ADDED Viewed

+import gradio as gr
+from transformers import pipeline
+from fpdf import FPDF
+import librosa
+def transcribe_and_generate_pdf(audio_file):
+    transcriber = pipeline("automatic-speech-recognition", model="openai/whisper-large")
+    audio, _ = librosa.load(audio_file, sr=16000)
+    transcription = transcriber(audio)["text"]
+    output_pdf = "transcription.pdf"
+    pdf = FPDF()
+    pdf.add_page()
+    pdf.set_font("Arial", size=12)
+    pdf.multi_cell(0, 10, transcription)
+    pdf.output(output_pdf)
+    return transcription, output_pdf
+interface = gr.Interface(
+    fn=transcribe_and_generate_pdf,
+    inputs=gr.Audio(source="upload", type="filepath"),
+    outputs=[gr.Textbox(label="Transcription"), gr.File(label="Download PDF")],
+    title="Audio-to-Text and PDF Generator",
+)
+if __name__ == "__main__":
+    interface.launch()