Spaces:

SoulofSukuna
/

Tor-Search-Api

Running

App Files Files Community

SoulofSukuna commited on Sep 5, 2024

Commit

48c7ef6

verified ·

1 Parent(s): 77c14b6

Update torrents/x1337.py

Browse files

Files changed (1) hide show

torrents/x1337.py +83 -73

torrents/x1337.py CHANGED Viewed

@@ -1,61 +1,67 @@
 import asyncio
 import re
 import time
-import cloudscraper
 from bs4 import BeautifulSoup
 from helper.asyncioPoliciesFix import decorator_asyncio_fix
 from constants.base_url import X1337
 from constants.headers import HEADER_AIO
 class x1337:
     def __init__(self):
         self.BASE_URL = X1337
         self.LIMIT = None
-        # Initialize the CloudScraper instance
-        self.scraper = cloudscraper.create_scraper()
     @decorator_asyncio_fix
-    async def _individual_scrap(self, url, obj):
         try:
-            # Use asyncio.to_thread to run the synchronous CloudScraper in a separate thread
-            html = await asyncio.to_thread(self.scraper.get, url, headers=HEADER_AIO)
-            html = html.text
-            soup = BeautifulSoup(html, "html.parser")
-            try:
-                magnet = soup.select_one(".no-top-radius > div > ul > li > a")["href"]
-                uls = soup.find_all("ul", class_="list")[1]
-                lis = uls.find_all("li")[0]
-                imgs = [
-                    img["data-original"]
-                    for img in (soup.find("div", id="description")).find_all("img")
-                    if img["data-original"].endswith((".png", ".jpg", ".jpeg"))
-                ]
-                files = [f.text for f in soup.find("div", id="files").find_all("li")]
-                if len(imgs) > 0:
-                    obj["screenshot"] = imgs
-                obj["category"] = lis.find("span").text
-                obj["files"] = files
                 try:
-                    poster = soup.select_one("div.torrent-image img")["src"]
-                    if str(poster).startswith("//"):
-                        obj["poster"] = "https:" + poster
-                    elif str(poster).startswith("/"):
-                        obj["poster"] = self.BASE_URL + poster
-                except:
-                    pass
-                obj["magnet"] = magnet
-                obj["hash"] = re.search(r"([{a-f\d,A-F\d}]{32,40})\b", magnet).group(0)
-            except IndexError:
-                pass
         except:
             return None
-    async def _get_torrent(self, result, urls):
         tasks = []
         for idx, url in enumerate(urls):
             for obj in result["data"]:
                 if obj["url"] == url:
-                    task = asyncio.create_task(self._individual_scrap(url, result["data"][idx]))
                     tasks.append(task)
         await asyncio.gather(*tasks)
         return result
@@ -101,47 +107,48 @@ class x1337:
                     else:
                         my_dict["total_pages"] = int(pages[-1].text)
                 except:
-                    pass
                 return my_dict, list_of_urls
         except:
             return None, None
     async def search(self, query, page, limit):
-        self.LIMIT = limit
-        start_time = time.time()
-        url = self.BASE_URL + "/search/{}/{}/".format(query, page)
-        return await self.parser_result(start_time, url, query=query, page=page)
-    async def parser_result(self, start_time, url, page, query=None):
-        # Use asyncio.to_thread to call the blocking CloudScraper's get method asynchronously
-        html = await asyncio.to_thread(self.scraper.get, url, headers=HEADER_AIO)
-        htmls = [html.text]
         result, urls = self._parser(htmls)
         if result is not None:
-            results = await self._get_torrent(result, urls)
             results["time"] = time.time() - start_time
             results["total"] = len(results["data"])
             if query is None:
                 return results
             while True:
                 if len(results["data"]) >= self.LIMIT:
-                    results["data"] = results["data"][: self.LIMIT]
                     results["total"] = len(results["data"])
                     return results
-                page += 1
                 url = self.BASE_URL + "/search/{}/{}/".format(query, page)
-                html = await asyncio.to_thread(self.scraper.get, url, headers=HEADER_AIO)
-                htmls = [html.text]
                 result, urls = self._parser(htmls)
                 if result is not None:
                     if len(result["data"]) > 0:
-                        res = await self._get_torrent(result, urls)
                         for obj in res["data"]:
                             results["data"].append(obj)
                         try:
                             results["current_page"] = res["current_page"]
                         except:
-                            pass
                         results["time"] = time.time() - start_time
                         results["total"] = len(results["data"])
                     else:
@@ -152,29 +159,32 @@ class x1337:
         return result
     async def trending(self, category, page, limit):
-        start_time = time.time()
-        self.LIMIT = limit
-        if not category:
-            url = self.BASE_URL + "/home/"
-        else:
-            url = self.BASE_URL + "/popular-{}".format(category.lower())
-        return await self.parser_result(start_time, url, page)
     async def recent(self, category, page, limit):
-        start_time = time.time()
-        self.LIMIT = limit
-        if not category:
-            url = self.BASE_URL + "/trending"
-        else:
-            url = self.BASE_URL + "/cat/{}/{}/".format(
-                str(category).capitalize(), page
-            )
-        return await self.parser_result(start_time, url, page)
     async def search_by_category(self, query, category, page, limit):
-        start_time = time.time()
-        self.LIMIT = limit
-        url = self.BASE_URL + "/category-search/{}/{}/{}/".format(
-            query, category.capitalize(), page
-        )
-        return await self.parser_result(start_time, url, page, query)

 import asyncio
 import re
 import time
+import aiohttp
 from bs4 import BeautifulSoup
 from helper.asyncioPoliciesFix import decorator_asyncio_fix
+from helper.async_cloudscraper import AsyncCloudscraper  # Changed import
 from constants.base_url import X1337
 from constants.headers import HEADER_AIO
 class x1337:
     def __init__(self):
         self.BASE_URL = X1337
         self.LIMIT = None
     @decorator_asyncio_fix
+    async def _individual_scrap(self, session, url, obj):
         try:
+            async with session.get(url, headers=HEADER_AIO) as res:
+                html = await res.text(encoding="ISO-8859-1")
+                soup = BeautifulSoup(html, "html.parser")
                 try:
+                    magnet = soup.select_one(".no-top-radius > div > ul > li > a")["href"]
+                    uls = soup.find_all("ul", class_="list")[1]
+                    lis = uls.find_all("li")[0]
+                    imgs = [
+                        img["data-original"]
+                        for img in (soup.find("div", id="description")).find_all("img")
+                        if img["data-original"].endswith((".png", ".jpg", ".jpeg"))
+                    ]
+                    files = [
+                        f.text for f in soup.find("div", id="files").find_all("li")
+                    ]
+                    if len(imgs) > 0:
+                        obj["screenshot"] = imgs
+                    obj["category"] = lis.find("span").text
+                    obj["files"] = files
+                    try:
+                        poster = soup.select_one("div.torrent-image img")["src"]
+                        if str(poster).startswith("//"):
+                            obj["poster"] = "https:" + poster
+                        elif str(poster).startswith("/"):
+                            obj["poster"] = self.BASE_URL + poster
+                    except:
+                        ...
+                    obj["magnet"] = magnet
+                    obj["hash"] = re.search(
+                        r"([{a-f\d,A-F\d}]{32,40})\b", magnet
+                    ).group(0)
+                except IndexError:
+                    ...
         except:
             return None
+    async def _get_torrent(self, result, session, urls):
         tasks = []
         for idx, url in enumerate(urls):
             for obj in result["data"]:
                 if obj["url"] == url:
+                    task = asyncio.create_task(
+                        self._individual_scrap(session, url, result["data"][idx])
+                    )
                     tasks.append(task)
         await asyncio.gather(*tasks)
         return result
                     else:
                         my_dict["total_pages"] = int(pages[-1].text)
                 except:
+                    ...
                 return my_dict, list_of_urls
         except:
             return None, None
     async def search(self, query, page, limit):
+        async with aiohttp.ClientSession() as session:
+            self.LIMIT = limit
+            start_time = time.time()
+            url = self.BASE_URL + "/search/{}/{}/".format(query, page)
+            return await self.parser_result(
+                start_time, url, session, query=query, page=page
+            )
+    async def parser_result(self, start_time, url, session, page, query=None):
+        # Use AsyncCloudscraper instead of Scraper
+        htmls = await AsyncCloudscraper().get_all_results(url)
         result, urls = self._parser(htmls)
         if result is not None:
+            results = await self._get_torrent(result, session, urls)
             results["time"] = time.time() - start_time
             results["total"] = len(results["data"])
             if query is None:
                 return results
             while True:
                 if len(results["data"]) >= self.LIMIT:
+                    results["data"] = results["data"][0 : self.LIMIT]
                     results["total"] = len(results["data"])
                     return results
+                page = page + 1
                 url = self.BASE_URL + "/search/{}/{}/".format(query, page)
+                htmls = await AsyncCloudscraper().get_all_results(url)  # Changed Scraper
                 result, urls = self._parser(htmls)
                 if result is not None:
                     if len(result["data"]) > 0:
+                        res = await self._get_torrent(result, session, urls)
                         for obj in res["data"]:
                             results["data"].append(obj)
                         try:
                             results["current_page"] = res["current_page"]
                         except:
+                            ...
                         results["time"] = time.time() - start_time
                         results["total"] = len(results["data"])
                     else:
         return result
     async def trending(self, category, page, limit):
+        async with aiohttp.ClientSession() as session:
+            start_time = time.time()
+            self.LIMIT = limit
+            if not category:
+                url = self.BASE_URL + "/home/"
+            else:
+                url = self.BASE_URL + "/popular-{}".format(category.lower())
+            return await self.parser_result(start_time, url, session, page)
     async def recent(self, category, page, limit):
+        async with aiohttp.ClientSession() as session:
+            start_time = time.time()
+            self.LIMIT = limit
+            if not category:
+                url = self.BASE_URL + "/trending"
+            else:
+                url = self.BASE_URL + "/cat/{}/{}/".format(
+                    str(category).capitalize(), page
+                )
+            return await self.parser_result(start_time, url, session, page)
     async def search_by_category(self, query, category, page, limit):
+        async with aiohttp.ClientSession() as session:
+            start_time = time.time()
+            self.LIMIT = limit
+            url = self.BASE_URL + "/category-search/{}/{}/{}/".format(
+                query, category.capitalize(), page
+            )
+            return await self.parser_result(start_time, url, session, page, query)