Spaces:

joshuadunlop
/

dataforseo_Backlink-Exporter

Sleeping

App Files Files Community

joshuadunlop commited on Jan 24, 2024

Commit

f813149

verified ·

1 Parent(s): 59b9ed4

Update app.py

Browse files

Files changed (1) hide show

app.py +22 -77

app.py CHANGED Viewed

@@ -8,15 +8,10 @@ from io import StringIO
 import csv
 def get_backlinks(api_login, api_key, target_url, filters):
-    # Encoding credentials
     encoded_credentials = base64.b64encode(f"{api_login}:{api_key}".encode()).decode()
-    # Setting headers with Basic Authentication
     headers = {
         'Authorization': f'Basic {encoded_credentials}'
     }
-    # Prepare post data
     post_data = {
         0: {
             "target": target_url,
@@ -25,24 +20,13 @@ def get_backlinks(api_login, api_key, target_url, filters):
             "filters": filters
         }
     }
-    # Making the API request
     response = requests.post("https://api.dataforseo.com/v3/backlinks/backlinks/live", json=post_data, headers=headers)
-    response_json = response.json()
-    # Check if the response contains 'results' key and handle the JSON structure appropriately
     if response.status_code == 200:
         response_data = response.json()
         if 'tasks' in response_data:
-            # Assuming there is only one task and one result within each task
             task_result = response_data['tasks'][0]['result']
             if task_result and 'items' in task_result[0]:
-                # The actual backlink items are nested within 'items'
                 items = task_result[0]['items']
-                # Convert to DataFrame
                 df = pd.json_normalize(items)
                 return df
             else:
@@ -57,10 +41,8 @@ def get_backlinks(api_login, api_key, target_url, filters):
         return None
 def convert_df_to_csv(df):
-    # Convert DataFrame to CSV
     return df.to_csv(index=False).encode('utf-8')
-# Worker thread to handle concurrent API calls
 class BacklinkWorker(threading.Thread):
     def __init__(self, jobs, results, api_login, api_key):
         super().__init__()
@@ -78,18 +60,15 @@ class BacklinkWorker(threading.Thread):
             df = get_backlinks(self.api_login, self.api_key, target_url, filters)
             self.results.put((url_id, df))
-# Function to process pasted data
 def process_pasted_data(data):
     data_io = StringIO(data.strip())
     reader = csv.reader(data_io, delimiter='\n', quotechar='"')
     return [row[0] for row in reader]
-# Streamlit layout
 st.sidebar.title("DataForSEO API Parameters")
 api_login = st.sidebar.text_input("API Login", value="[email protected]")
 api_key = st.sidebar.text_input("API Key", type="password")
-# Filters input
 st.sidebar.title("Filters")
 st.sidebar.info ("A maximum of 8 filters are allowed through the API. That includes one for every comma-separated value below, one for every value not equal to 0 in the boxes, one for language, and one for each button ticked.")
 url_from_not_contain = st.sidebar.text_input("URL from does not contain (comma-separated)", value="keyword,blogspot,/search,/tag")
@@ -140,14 +119,12 @@ filters.append("and")
 if filters and filters[-1] == "and":
     filters.pop()
-# Sidebar options for concurrency and pasting data
 num_concurrent_calls = st.sidebar.number_input("Concurrent Calls:", min_value=1, max_value=10, value=5, step=1)
 data_section = st.sidebar.text_area("Paste Data:")
 paste_data = st.sidebar.button("Paste Data")
 add_row = st.sidebar.button("Add Row")
 reset = st.sidebar.button("Reset")
-# Managing rows and pasted data
 if paste_data:
     pasted_urls = process_pasted_data(data_section)
     for i, url in enumerate(pasted_urls):
@@ -161,74 +138,42 @@ if add_row:
 if reset:
     st.session_state.clear()
-# Generate and reset button logic
-generate_pressed = st.sidebar.button("Generate All")
-if generate_pressed:
-    st.session_state['generate_pressed'] = True
-# Main app layout
 row_count = st.session_state.get("row_count", 1)
-# Define placeholders for each row in the second column
-download_placeholders = [st.empty() for _ in range(row_count)]
-for i, (col1_placeholder, col2_placeholder) in enumerate(placeholders):
     target_url_key = f"target_url_{i}"
-    with col1_placeholder.container():
-        st.text_input(f"Enter the target URL {i + 1}", key=target_url_key)
-if 'generate_pressed' in st.session_state and st.session_state['generate_pressed']:
     jobs = Queue()
     results = Queue()
     workers = [BacklinkWorker(jobs, results, api_login, api_key) for _ in range(num_concurrent_calls)]
     for worker in workers:
         worker.start()
     for i in range(row_count):
         target_url = st.session_state.get(f"target_url_{i}", "")
         if target_url:
             jobs.put((i, target_url, filters))
     for _ in workers:
         jobs.put(None)
     for worker in workers:
         worker.join()
     while not results.empty():
         url_id, df = results.get()
         st.session_state[f"df_{url_id}"] = df
-    # Update placeholders in the second column
-    for i, (_, col2_placeholder) in enumerate(placeholders):
-        df_key = f"df_{i}"
-        df = st.session_state.get(df_key)
-        with col2_placeholder.container():
-            if df is not None:
-                csv = convert_df_to_csv(df)
-                st.download_button(
-                    label=f"Download data as CSV for URL {i + 1}",
-                    data=csv,
-                    file_name=f'backlinks_{i + 1}.csv',
-                    mime='text/csv',
-                )
-            else:
-                st.error(f"Failed to generate CSV for URL {i + 1}: No data returned from the API or data processing error.")
-# Display and download logic for each row
-for i in range(row_count):
-    df_key = f"df_{i}"
-    df = st.session_state.get(df_key)
-    if df is not None:
-        csv = convert_df_to_csv(df)
-        st.download_button(
-            label=f"Download data as CSV for URL {i + 1}",
-            data=csv,
-            file_name=f'backlinks_{i + 1}.csv',
-            mime='text/csv',
-        )
-    elif df is None and generate_button:
-        st.error(f"Failed to generate CSV for URL {i + 1}: No data returned from the API or data processing error.")

 import csv
 def get_backlinks(api_login, api_key, target_url, filters):
     encoded_credentials = base64.b64encode(f"{api_login}:{api_key}".encode()).decode()
     headers = {
         'Authorization': f'Basic {encoded_credentials}'
     }
     post_data = {
         0: {
             "target": target_url,
             "filters": filters
         }
     }
     response = requests.post("https://api.dataforseo.com/v3/backlinks/backlinks/live", json=post_data, headers=headers)
     if response.status_code == 200:
         response_data = response.json()
         if 'tasks' in response_data:
             task_result = response_data['tasks'][0]['result']
             if task_result and 'items' in task_result[0]:
                 items = task_result[0]['items']
                 df = pd.json_normalize(items)
                 return df
             else:
         return None
 def convert_df_to_csv(df):
     return df.to_csv(index=False).encode('utf-8')
 class BacklinkWorker(threading.Thread):
     def __init__(self, jobs, results, api_login, api_key):
         super().__init__()
             df = get_backlinks(self.api_login, self.api_key, target_url, filters)
             self.results.put((url_id, df))
 def process_pasted_data(data):
     data_io = StringIO(data.strip())
     reader = csv.reader(data_io, delimiter='\n', quotechar='"')
     return [row[0] for row in reader]
 st.sidebar.title("DataForSEO API Parameters")
 api_login = st.sidebar.text_input("API Login", value="[email protected]")
 api_key = st.sidebar.text_input("API Key", type="password")
 st.sidebar.title("Filters")
 st.sidebar.info ("A maximum of 8 filters are allowed through the API. That includes one for every comma-separated value below, one for every value not equal to 0 in the boxes, one for language, and one for each button ticked.")
 url_from_not_contain = st.sidebar.text_input("URL from does not contain (comma-separated)", value="keyword,blogspot,/search,/tag")
 if filters and filters[-1] == "and":
     filters.pop()
 num_concurrent_calls = st.sidebar.number_input("Concurrent Calls:", min_value=1, max_value=10, value=5, step=1)
 data_section = st.sidebar.text_area("Paste Data:")
 paste_data = st.sidebar.button("Paste Data")
 add_row = st.sidebar.button("Add Row")
 reset = st.sidebar.button("Reset")
 if paste_data:
     pasted_urls = process_pasted_data(data_section)
     for i, url in enumerate(pasted_urls):
 if reset:
     st.session_state.clear()
 row_count = st.session_state.get("row_count", 1)
+for i in range(row_count):
+    col1, col2 = st.columns([3, 1])
     target_url_key = f"target_url_{i}"
+    with col1:
+        target_url = st.text_input(f"Enter the target URL {i + 1}", key=target_url_key)
+    df_key = f"df_{i}"
+    df = st.session_state.get(df_key)
+    with col2:
+        if df is not None:
+            csv = convert_df_to_csv(df)
+            st.download_button(
+                label=f"Download CSV for URL {i + 1}",
+                data=csv,
+                file_name=f'backlinks_{i + 1}.csv',
+                mime='text/csv',
+            )
+        elif df is None and st.sidebar.button("Generate All"):
+            st.error(f"Failed for URL {i + 1}: No data or error.")
+generate_button = st.sidebar.button("Generate All")
+if generate_button:
     jobs = Queue()
     results = Queue()
     workers = [BacklinkWorker(jobs, results, api_login, api_key) for _ in range(num_concurrent_calls)]
     for worker in workers:
         worker.start()
     for i in range(row_count):
         target_url = st.session_state.get(f"target_url_{i}", "")
         if target_url:
             jobs.put((i, target_url, filters))
     for _ in workers:
         jobs.put(None)
     for worker in workers:
         worker.join()
     while not results.empty():
         url_id, df = results.get()
         st.session_state[f"df_{url_id}"] = df