Spaces:

harshpatel080503
/

yougpt

Sleeping

harshpatel080503 commited on May 26

Commit

c31dfff

verified ·

1 Parent(s): 694e6a8

Update rag_chain.py

Files changed (1) hide show

rag_chain.py CHANGED Viewed

@@ -51,15 +51,18 @@ Answer:""",
     input_variables=["context", "question"],
 )
-# Updated to optionally accept proxies
-def fetch_transcript(video_id: str, proxies: dict = None) -> str:
     try:
-        # If proxies are provided, patch requests.Session to use them
-        if proxies:
-            session = requests.Session()
-            session.proxies.update(proxies)
-            # Monkey patch the YouTubeTranscriptApi's internal session to use proxy
-            YouTubeTranscriptApi._requests = session
         transcript = YouTubeTranscriptApi.get_transcript(video_id, languages=["en", "hi"])
         return " ".join([t["text"] for t in transcript])
@@ -69,9 +72,10 @@ def fetch_transcript(video_id: str, proxies: dict = None) -> str:
     except Exception as e:
         raise Exception(f"Error fetching transcript: {str(e)}")
 # Build RAG chain from transcript
-def build_chain(video_id: str, proxies: dict = None) -> RetrievalQA:
-    text = fetch_transcript(video_id, proxies=proxies)
     splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
     docs = splitter.create_documents([text])

     input_variables=["context", "question"],
 )
+def fetch_transcript(video_id: str) -> str:
     try:
+        # ✅ Define your proxy here
+        proxies = {
+            "http": "http://219.65.73.81:80",
+            "https": "http://219.65.73.81:80"
+        }
+        # Patch requests session with proxy
+        session = requests.Session()
+        session.proxies.update(proxies)
+        YouTubeTranscriptApi._requests = session  # monkey patch
         transcript = YouTubeTranscriptApi.get_transcript(video_id, languages=["en", "hi"])
         return " ".join([t["text"] for t in transcript])
     except Exception as e:
         raise Exception(f"Error fetching transcript: {str(e)}")
 # Build RAG chain from transcript
+def build_chain(video_id: str) -> RetrievalQA:
+    text = fetch_transcript(video_id)
     splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
     docs = splitter.create_documents([text])