Spaces:

DrishtiSharma
/

chat-w-docs-via-speech-or-text

Sleeping

App Files Files Community

DrishtiSharma commited on Dec 9, 2024

Commit

0aba088

verified ·

1 Parent(s): abce794

Update app.py

Browse files

Files changed (1) hide show

app.py +12 -22

app.py CHANGED Viewed

@@ -3,14 +3,12 @@
 import os
 import chromadb
 import streamlit as st
-from base64 import b64decode
 from langchain_huggingface import HuggingFaceEmbeddings
 from langchain_chroma import Chroma
 from langchain_groq import ChatGroq
 from langchain.memory import ConversationBufferMemory
 from langchain.chains import ConversationalRetrievalChain
 from PyPDF2 import PdfReader
-from streamlit_audio_recorder import st_audio_recorder
 from groq import Groq
 # Clear ChromaDB cache to fix tenant issue
@@ -19,7 +17,7 @@ chromadb.api.client.SharedSystemClient.clear_system_cache()
 # Ensure required environment variables are set
 GROQ_API_KEY = os.getenv("GROQ_API_KEY")
 if not GROQ_API_KEY:
-    st.error("GROQ_API_KEY is not set. Please configure it in your environment variables.")
     st.stop()
 # Initialize Groq Client for transcription and LLM
@@ -53,18 +51,6 @@ def chat_chain(vectorstore):
     )
     return chain
-# Function to record audio using streamlit_audio_recorder
-def record_audio():
-    st.write("Click below to record your audio:")
-    audio_bytes = st_audio_recorder()
-    if audio_bytes:
-        audio_file_path = "recorded_audio.wav"
-        with open(audio_file_path, "wb") as f:
-            f.write(audio_bytes)
-        st.success("Audio recorded successfully!")
-        return audio_file_path
-    return None
 # Transcribe audio using Groq Whisper
 def transcribe_audio(file_path):
     """Transcribe audio using Groq's Whisper model."""
@@ -87,7 +73,7 @@ if uploaded_files:
     chain = chat_chain(vectorstore)
     st.success("PDFs processed! Ready to chat.")
-    input_method = st.radio("Choose Input Method", ["Text Input", "Audio Input"])
     # Text Input Mode
     if input_method == "Text Input":
@@ -97,13 +83,17 @@ if uploaded_files:
                 response = chain({"question": query})["answer"]
                 st.write(f"**Response:** {response}")
-    # Audio Input Mode
-    elif input_method == "Audio Input":
-        audio_file = record_audio()
-        if audio_file:
-            st.audio(audio_file, format="audio/wav")
             st.write("Transcribing audio...")
-            transcription = transcribe_audio(audio_file)
             st.write(f"**You said:** {transcription}")
             with st.spinner("Generating response..."):

 import os
 import chromadb
 import streamlit as st
 from langchain_huggingface import HuggingFaceEmbeddings
 from langchain_chroma import Chroma
 from langchain_groq import ChatGroq
 from langchain.memory import ConversationBufferMemory
 from langchain.chains import ConversationalRetrievalChain
 from PyPDF2 import PdfReader
 from groq import Groq
 # Clear ChromaDB cache to fix tenant issue
 # Ensure required environment variables are set
 GROQ_API_KEY = os.getenv("GROQ_API_KEY")
 if not GROQ_API_KEY:
+    st.error("GROQ_API_KEY is not set. Please configure it in environment variables.")
     st.stop()
 # Initialize Groq Client for transcription and LLM
     )
     return chain
 # Transcribe audio using Groq Whisper
 def transcribe_audio(file_path):
     """Transcribe audio using Groq's Whisper model."""
     chain = chat_chain(vectorstore)
     st.success("PDFs processed! Ready to chat.")
+    input_method = st.radio("Choose Input Method", ["Text Input", "Audio File Upload"])
     # Text Input Mode
     if input_method == "Text Input":
                 response = chain({"question": query})["answer"]
                 st.write(f"**Response:** {response}")
+    # Audio Input Mode (File Upload)
+    elif input_method == "Audio File Upload":
+        uploaded_audio = st.file_uploader("Upload an audio file (.wav, .mp3)", type=["wav", "mp3"])
+        if uploaded_audio:
+            audio_file_path = "uploaded_audio.wav"
+            with open(audio_file_path, "wb") as f:
+                f.write(uploaded_audio.read())
+            st.audio(audio_file_path, format="audio/wav")
             st.write("Transcribing audio...")
+            transcription = transcribe_audio(audio_file_path)
             st.write(f"**You said:** {transcription}")
             with st.spinner("Generating response..."):