Spaces:

Johan713
/

aAzelll

Sleeping

App Files Files Community

Johan713 commited on Aug 4, 2024

Commit

5203f09

verified ·

1 Parent(s): 53a2571

Update app2.py

Browse files

Files changed (1) hide show

app2.py +51 -29

app2.py CHANGED Viewed

@@ -329,23 +329,27 @@ def query_public_case_law(query: str) -> List[Dict[str, Any]]:
         'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
     }
     try:
-        justia_response = requests.get(justia_url, headers=justia_headers)
-        justia_response.raise_for_status()
         justia_soup = BeautifulSoup(justia_response.text, 'html.parser')
         justia_results = justia_soup.find_all('div', class_='case-listing')
         for result in justia_results[:3]:  # Limit Justia results to 3
-            title = result.find('h6').text.strip()
-            citation = result.find('p', class_='citation').text.strip()
-            summary = result.find('p', class_='summary').text.strip()
-            url = result.find('a')['href']
-            cases.append({
-                "source": "Justia",
-                "case_name": title,
-                "citation": citation,
-                "summary": summary,
-                "url": url
-            })
     except requests.RequestException as e:
         print(f"Error querying Justia: {e}")
@@ -353,33 +357,51 @@ def query_public_case_law(query: str) -> List[Dict[str, Any]]:
     courtlistener_url = f"https://www.courtlistener.com/api/rest/v3/search/?q={query}&type=o&format=json"
     for attempt in range(3):  # Retry up to 3 times
         try:
-            courtlistener_response = requests.get(courtlistener_url)
             courtlistener_response.raise_for_status()
             courtlistener_data = courtlistener_response.json()
-            break
         except (requests.RequestException, ValueError) as e:
             print(f"Attempt {attempt + 1} failed: {e}")
             if attempt == 2:
-                print(
-                    f"Failed to retrieve or parse data from CourtListener: {e}"
-                )
-                break
             time.sleep(2)
     if 'results' in courtlistener_data:
-        for result in courtlistener_data['results'][:3]:  # Limit to 3 results
-            case_url = f"https://www.courtlistener.com{result['absolute_url']}"
-            cases.append({
-                "source": "CourtListener",
-                "case_name": result['caseName'],
-                "date_filed": result['dateFiled'],
-                "docket_number": result.get('docketNumber', 'Not available'),
-                "court": result['court'],
-                "url": case_url
-            })
     return cases
 def comprehensive_document_analysis(content: str) -> Dict[str, Any]:
     """Performs a comprehensive analysis of the document, including web and Wikipedia searches."""
     try:

         'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
     }
     try:
+        justia_response = requests.get(justia_url, headers=justia_headers, timeout=10)  # Set a timeout
+        justia_response.raise_for_status()  # Raise an exception for bad status codes
         justia_soup = BeautifulSoup(justia_response.text, 'html.parser')
         justia_results = justia_soup.find_all('div', class_='case-listing')
         for result in justia_results[:3]:  # Limit Justia results to 3
+            try:  # Handle potential errors within each result
+                title = result.find('h6').text.strip()
+                citation = result.find('p', class_='citation').text.strip()
+                summary = result.find('p', class_='summary').text.strip()
+                url = result.find('a')['href']
+                cases.append({
+                    "source": "Justia",
+                    "case_name": title,
+                    "citation": citation,
+                    "summary": summary,
+                    "url": url
+                })
+            except Exception as e:
+                print(f"Error processing Justia result: {e}")
     except requests.RequestException as e:
         print(f"Error querying Justia: {e}")
     courtlistener_url = f"https://www.courtlistener.com/api/rest/v3/search/?q={query}&type=o&format=json"
     for attempt in range(3):  # Retry up to 3 times
         try:
+            courtlistener_response = requests.get(courtlistener_url, timeout=10)
             courtlistener_response.raise_for_status()
             courtlistener_data = courtlistener_response.json()
+            break  # Exit the loop if successful
         except (requests.RequestException, ValueError) as e:
             print(f"Attempt {attempt + 1} failed: {e}")
             if attempt == 2:
+                print(f"Failed to retrieve or parse data from CourtListener: {e}")
             time.sleep(2)
     if 'results' in courtlistener_data:
+        for result in courtlistener_data['results'][:3]:
+            try:
+                case_url = f"https://www.courtlistener.com{result['absolute_url']}"
+                # Fetch case page content to extract summary
+                case_page_response = requests.get(case_url, timeout=10)
+                case_page_response.raise_for_status()
+                case_page_soup = BeautifulSoup(case_page_response.text, 'html.parser')
+                # Extract the summary
+                summary = extract_courtlistener_summary(case_page_soup)
+                cases.append({
+                    "source": "CourtListener",
+                    "case_name": result['caseName'],
+                    "date_filed": result['dateFiled'],
+                    "docket_number": result.get('docketNumber', 'Not available'),
+                    "court": result['court'],
+                    "url": case_url,
+                    "summary": summary  # Add the extracted summary
+                })
+            except Exception as e:
+                print(f"Error processing CourtListener result: {e}")
     return cases
+def extract_courtlistener_summary(soup: BeautifulSoup) -> str:
+    """Extracts the case summary from a CourtListener case page."""
+    summary_element = soup.find('div', class_='summary')
+    if summary_element:
+        return summary_element.get_text(strip=True)
+    else:
+        return "Summary not available."
 def comprehensive_document_analysis(content: str) -> Dict[str, Any]:
     """Performs a comprehensive analysis of the document, including web and Wikipedia searches."""
     try: