Spaces:

OrganizedProgrammers
/

3GPPDocFinder

Running

App Files Files Community

Omar ID EL MOUMEN commited on 6 days ago

Commit

e584cfd

1 Parent(s): ae9ea80

Remove old function

Browse files

Files changed (1) hide show

app.py +69 -69

app.py CHANGED Viewed

@@ -366,7 +366,7 @@ async def main_menu():
     return FileResponse(os.path.join("templates", "index.html"))
 @app.post("/search-spec", response_model=KeywordResponse)
-def search_spec_v2(request: KeywordRequest):
     start_time = time.time()
     kws = [_.lower() for _ in request.keywords.split(" ")]
     results = []
@@ -398,80 +398,80 @@ def search_spec_v2(request: KeywordRequest):
     else:
         raise HTTPException(status_code=404, detail="Specifications not found")
-def search_spec(request: KeywordRequest):
-    chars = "0123456789abcdefghijklmnopqrstuvwxyz"
-    start_time = time.time()
-    response = requests.get(f'https://www.3gpp.org/dynareport?code=status-report.htm', headers={"User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'}, verify=False)
-    dfs = pd.read_html(StringIO(response.text), storage_options={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'}, encoding="utf-8")
-    for x in range(len(dfs)):
-        dfs[x] = dfs[x].replace({np.nan: None})
-    columns_needed = [0, 1, 2, 3, 4]
-    extracted_dfs: List[pd.DataFrame] = [df.iloc[:, columns_needed] for df in dfs]
-    columns = [x.replace("\xa0", "_") for x in extracted_dfs[0].columns]
-    specifications = []
-    for df in extracted_dfs:
-        for index, row in df.iterrows():
-            doc = row.to_list()
-            doc_dict = dict(zip(columns, doc))
-            specifications.append(doc_dict)
-    kws = [_.lower() for _ in request.keywords.split(" ")]
-    results = []
-    for spec in specifications:
-        if request.mode == "and":
-            if not all(kw in spec["title"].lower() for kw in kws):
-                continue
-        elif request.mode == "or":
-            if not any(kw in spec["title"].lower() for kw in kws):
-                continue
-        release = request.release
-        working_group = request.wg
-        spec_type = request.spec_type
-        if spec.get('vers', None) is None or (release is not None and spec["vers"].split(".")[0] != str(release)):
-            continue
-        if spec.get('WG', None) is None or (working_group is not None and spec["WG"] != working_group):
-            continue
-        if spec_type is not None and spec["type"] != spec_type:
-            continue
-        doc_id = str(spec["spec_num"])
-        series = doc_id.split(".")[0]
-        a, b, c = str(spec["vers"]).split(".")
-        print(spec["vers"])
-        if not (int(a) > 35 or int(b) > 35 or int(c) > 35):
-            spec_url = f"https://www.3gpp.org/ftp/Specs/archive/{series}_series/{doc_id}/{doc_id.replace('.', '')}-{chars[int(a)]}{chars[int(b)]}{chars[int(c)]}.zip"
-        else:
-            x,y,z = str(a), str(b), str(c)
-            while len(x) < 2:
-                x = "0" + x
-            while len(y) < 2:
-                y = "0" + y
-            while len(z) < 2:
-                z = "0" + z
-            spec_url = f"https://www.3gpp.org/ftp/Specs/archive/{series}_series/{doc_id}/{doc_id.replace('.', '')}-{x}{y}{z}.zip"
-        results.append({
-            "id": str(spec["spec_num"]),
-            "title": spec["title"],
-            "type": "Technical Specification" if spec["type"] == "TS" else "Technical Report",
-            "release": str(spec["vers"].split(".")[0]),
-            "version": str(spec["vers"]),
-            "working_group": spec["WG"],
-            "url": spec_url
-        })
-    if len(results) > 0:
-        return KeywordResponse(
-            results=results,
-            search_time=time.time() - start_time
-        )
-    else:
-        raise HTTPException(status_code=404, detail="Specification not found")
 @app.post("/find", response_model=DocResponse)
 def find_document(request: DocRequest):

     return FileResponse(os.path.join("templates", "index.html"))
 @app.post("/search-spec", response_model=KeywordResponse)
+def search_spec(request: KeywordRequest):
     start_time = time.time()
     kws = [_.lower() for _ in request.keywords.split(" ")]
     results = []
     else:
         raise HTTPException(status_code=404, detail="Specifications not found")
+# def search_spec(request: KeywordRequest):
+#     chars = "0123456789abcdefghijklmnopqrstuvwxyz"
+#     start_time = time.time()
+#     response = requests.get(f'https://www.3gpp.org/dynareport?code=status-report.htm', headers={"User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'}, verify=False)
+#     dfs = pd.read_html(StringIO(response.text), storage_options={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'}, encoding="utf-8")
+#     for x in range(len(dfs)):
+#         dfs[x] = dfs[x].replace({np.nan: None})
+#     columns_needed = [0, 1, 2, 3, 4]
+#     extracted_dfs: List[pd.DataFrame] = [df.iloc[:, columns_needed] for df in dfs]
+#     columns = [x.replace("\xa0", "_") for x in extracted_dfs[0].columns]
+#     specifications = []
+#     for df in extracted_dfs:
+#         for index, row in df.iterrows():
+#             doc = row.to_list()
+#             doc_dict = dict(zip(columns, doc))
+#             specifications.append(doc_dict)
+#     kws = [_.lower() for _ in request.keywords.split(" ")]
+#     results = []
+#     for spec in specifications:
+#         if request.mode == "and":
+#             if not all(kw in spec["title"].lower() for kw in kws):
+#                 continue
+#         elif request.mode == "or":
+#             if not any(kw in spec["title"].lower() for kw in kws):
+#                 continue
+#         release = request.release
+#         working_group = request.wg
+#         spec_type = request.spec_type
+#         if spec.get('vers', None) is None or (release is not None and spec["vers"].split(".")[0] != str(release)):
+#             continue
+#         if spec.get('WG', None) is None or (working_group is not None and spec["WG"] != working_group):
+#             continue
+#         if spec_type is not None and spec["type"] != spec_type:
+#             continue
+#         doc_id = str(spec["spec_num"])
+#         series = doc_id.split(".")[0]
+#         a, b, c = str(spec["vers"]).split(".")
+#         print(spec["vers"])
+#         if not (int(a) > 35 or int(b) > 35 or int(c) > 35):
+#             spec_url = f"https://www.3gpp.org/ftp/Specs/archive/{series}_series/{doc_id}/{doc_id.replace('.', '')}-{chars[int(a)]}{chars[int(b)]}{chars[int(c)]}.zip"
+#         else:
+#             x,y,z = str(a), str(b), str(c)
+#             while len(x) < 2:
+#                 x = "0" + x
+#             while len(y) < 2:
+#                 y = "0" + y
+#             while len(z) < 2:
+#                 z = "0" + z
+#             spec_url = f"https://www.3gpp.org/ftp/Specs/archive/{series}_series/{doc_id}/{doc_id.replace('.', '')}-{x}{y}{z}.zip"
+#         results.append({
+#             "id": str(spec["spec_num"]),
+#             "title": spec["title"],
+#             "type": "Technical Specification" if spec["type"] == "TS" else "Technical Report",
+#             "release": str(spec["vers"].split(".")[0]),
+#             "version": str(spec["vers"]),
+#             "working_group": spec["WG"],
+#             "url": spec_url
+#         })
+#     if len(results) > 0:
+#         return KeywordResponse(
+#             results=results,
+#             search_time=time.time() - start_time
+#         )
+#     else:
+#         raise HTTPException(status_code=404, detail="Specification not found")
 @app.post("/find", response_model=DocResponse)
 def find_document(request: DocRequest):