import gradio as gr
import openai, os

from langchain.document_loaders.generic import GenericLoader
from langchain.document_loaders.parsers import OpenAIWhisperParser
from langchain.document_loaders.blob_loaders.youtube_audio import YoutubeAudioLoader

from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv())

openai.api_key = os.environ["OPENAI_API_KEY"]

def invoke(url):
    url = url
    save_dir = "docs/youtube/"
    loader = GenericLoader(
        YoutubeAudioLoader([url], save_dir),
        OpenAIWhisperParser()
    )
    docs = loader.load()
    print(url)
    print(docs[0].page_content)
    if (len(docs) > 1)
        print(docs[1].page_content)
    return docs[0].page_content

description = """<a href='https://www.gradio.app/'>Gradio</a> UI using <a href='https://platform.openai.com/'>OpenAI</a> API with Whisper 1 foundation model."""

gr.close_all()
demo = gr.Interface(fn=invoke, 
                    inputs = [gr.Textbox(label = "YouTube URL", lines = 1)],
                    outputs = [gr.Textbox(label = "Automatic Speech Recognition", lines = 1)],
                    title = "Generative AI - Audio",
                    description = description)
demo.launch()