GroqChatbot

Sleeping

App Files Files Community

wop commited on Apr 22, 2024

Commit

43afb9b

verified ·

1 Parent(s): ac020de

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -9

app.py CHANGED Viewed

@@ -74,23 +74,41 @@ def generate_chat_responses(chat_completion) -> Generator[str, None, None]:
             yield chunk.choices[0].delta.content
 def search_web(query):
     try:
         search_url = f"https://www.google.com/search?q={query}"
         response = requests.get(search_url)
         if response.status_code == 200:
             soup = BeautifulSoup(response.text, 'html.parser')
-            search_results = soup.find_all('div', class_='tF2Cxc')
-            results = []
-            for result in search_results:
-                title = result.find('h3').text
                 url = result.find('a')['href']
                 snippet = result.find('span', class_='aCOpRe').text
-                results.append({"title": title, "url": url, "snippet": snippet})
-            return results
         else:
-            return "Failed to retrieve search results"
     except Exception as e:
-        return f"An error occurred: {e}"
 full_response = None  # Initialize full_response to None
@@ -105,7 +123,7 @@ if prompt := st.chat_input("Enter your prompt here..."):
             query = prompt.lower().replace("search for", "").strip()
             search_results = search_web(query)
             formatted_results = "\n\n".join([f"Title: {result['title']}\nURL: {result['url']}\nSnippet: {result['snippet']}" for result in search_results])
-            #st.session_state.messages.append({"role": "assistant", "content": formatted_results})
             with st.chat_message("assistant", avatar="🤖"):
                full_response = formatted_results
         else:

             yield chunk.choices[0].delta.content
 def search_web(query):
+    result = {"query": query, "data": {}}
     try:
         search_url = f"https://www.google.com/search?q={query}"
         response = requests.get(search_url)
         if response.status_code == 200:
             soup = BeautifulSoup(response.text, 'html.parser')
+            # Scrape organic search results
+            result["data"]["organic"] = []
+            for result in soup.find_all('div', class_='g'):
+                title = result.find('a')['title']
                 url = result.find('a')['href']
                 snippet = result.find('span', class_='aCOpRe').text
+                item = {"title": title, "url": url, "snippet": snippet}
+                result["data"]["organic"].append(item)
+            # Scrape knowledge panel
+            result["data"]["knowledge_panel"] = {}
+            if soup.find('div', id='knowledge-kp'):
+                result["data"]["knowledge_panel"]["title"] = soup.find('div', id='knowledge-kp').find('h3').text
+                result["data"]["knowledge_panel"]["content"] = soup.find('div', id='knowledge-kp').find('div', class_='VwiC3b').text
+            # Scrape images
+            result["data"]["images"] = []
+            for result in soup.find_all('div', class_='hdtb-mitem hdtb-msel'):
+                title = result.find('a')['title']
+                url = result.find('a')['href']
+                snippet = ""
+                item = {"title": title, "url": url, "snippet": snippet}
+                result["data"]["images"].append(item)
         else:
+            result["error"] = "Failed to retrieve search results"
     except Exception as e:
+        result["error"] = f"An error occurred: {e}"
+    return result
 full_response = None  # Initialize full_response to None
             query = prompt.lower().replace("search for", "").strip()
             search_results = search_web(query)
             formatted_results = "\n\n".join([f"Title: {result['title']}\nURL: {result['url']}\nSnippet: {result['snippet']}" for result in search_results])
+            st.session_state.messages.append({"role": "assistant", "content": formatted_results})
             with st.chat_message("assistant", avatar="🤖"):
                full_response = formatted_results
         else: