Spaces:

Nattyboi
/

resume-api

Sleeping

Nattyboi commited on Mar 7

Commit

e295414

1 Parent(s): 5c6cdb1

added provider

Files changed (1) hide show

app.py CHANGED Viewed

@@ -66,7 +66,21 @@ def extract_course_info(text: str) -> CourseRecommendation:
     return CourseRecommendation(courseName=coursename, completionTime=completiontime)
 @app.get("/courses",tags=["Scrape"])
 def get_course(query):
@@ -79,11 +93,13 @@ def get_course(query):
             title = item.get('title')
             link = item.get('link')
             snippet = item.get('snippet')
             content_structure={}
             content_structure["courseTitle"]=title
             content_structure["courseLink"]=link
             content_structure["courseSnippet"]= snippet
             content_structure["scrapedCourseDetails"]= scrapeCourse(url=link)
             content.append(content_structure)

     return CourseRecommendation(courseName=coursename, completionTime=completiontime)
+import re
+from urllib.parse import urlparse
+def extract_provider(url):
+    # Parse the URL
+    parsed_url = urlparse(url)
+    # Extract domain and split it to get the main part
+    domain = parsed_url.netloc.split('.')[0]
+    # Extract course name
+    match = re.search(r'/course/([^/]+)/', url)
+    course_name = match.group(1) if match else "Not found"
+    return domain
 @app.get("/courses",tags=["Scrape"])
 def get_course(query):
             title = item.get('title')
             link = item.get('link')
             snippet = item.get('snippet')
+            provider = extract_provider(link)
             content_structure={}
             content_structure["courseTitle"]=title
             content_structure["courseLink"]=link
             content_structure["courseSnippet"]= snippet
+            content_structure["provider"]= provider
             content_structure["scrapedCourseDetails"]= scrapeCourse(url=link)
             content.append(content_structure)