Mohzen321 commited on
Commit
89c64dd
·
verified ·
1 Parent(s): d4eaaae

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +14 -37
app.py CHANGED
@@ -37,10 +37,8 @@ if uploaded_file is not None:
37
  "unknown_params": []
38
  }
39
 
40
- # قوائم لتحليل الصيغ وأنواع الروابط
41
  extensions = {}
42
- internal_links = []
43
- external_links = []
44
 
45
  # متغيرات للتحكم في العملية
46
  progress_bar = st.progress(0)
@@ -116,27 +114,21 @@ if uploaded_file is not None:
116
  score = result['scores'][0]
117
 
118
  if best_category == "shop" and score > 0.5:
119
- param_categories["shop_params"].append(f"{param}={re.search(param + r'=([^&]*)', url).group(1)}")
120
  elif best_category == "game" and score > 0.5:
121
- param_categories["game_params"].append(f"{param}={re.search(param + r'=([^&]*)', url).group(1)}")
122
  elif best_category == "stream" and score > 0.5:
123
- param_categories["stream_params"].append(f"{param}={re.search(param + r'=([^&]*)', url).group(1)}")
124
  else:
125
- param_categories["unknown_params"].append(f"{param}={re.search(param + r'=([^&]*)', url).group(1)}")
126
-
127
- # تصنيف الرابط بناءً على نوعه (داخلي/خارجي)
128
- if re.match(r'^https?://[^/]+\.example\.com', url):
129
- internal_links.append(url)
130
- else:
131
- external_links.append(url)
132
 
133
  # استخراج الصيغ (Extensions) من الروابط
134
  match = re.search(r'\.([a-zA-Z0-9]+)$', url)
135
  if match:
136
  ext = match.group(1)
137
  if ext not in extensions:
138
- extensions[ext] = []
139
- extensions[ext].append(url)
140
 
141
  # تحديث المؤشر الحالي
142
  current_index = i + batch_size
@@ -160,17 +152,13 @@ if uploaded_file is not None:
160
  st.session_state.unknown_text = "\n".join(unknown_items)
161
 
162
  # تحديث محتوى المربعات الخاصة بالباراميترات
163
- st.session_state.shop_params = "\n".join(param_categories["shop_params"])
164
- st.session_state.game_params = "\n".join(param_categories["game_params"])
165
- st.session_state.stream_params = "\n".join(param_categories["stream_params"])
166
- st.session_state.unknown_params = "\n".join(param_categories["unknown_params"])
167
-
168
- # تحديث محتوى المربعات الخاصة بأنواع الروابط
169
- st.session_state.internal_links = "\n".join(internal_links)
170
- st.session_state.external_links = "\n".join(external_links)
171
 
172
- # تحديث محتوى المربعات الخاصة بالصيغ
173
- st.session_state.extensions_text = "\n\n".join([f"{k}: {', '.join(v)}" for k, v in extensions.items()])
174
 
175
  # زر البدء
176
  if st.button("Start"):
@@ -247,18 +235,7 @@ if uploaded_file is not None:
247
  st.session_state.unknown_params = ""
248
  st.text_area("Copy the unknown parameters here:", value=st.session_state.unknown_params, height=200, key="unknown_params")
249
 
250
- # عرض أنواع الروابط
251
- st.header("Internal Links")
252
- if 'internal_links' not in st.session_state:
253
- st.session_state.internal_links = ""
254
- st.text_area("Copy the internal links here:", value=st.session_state.internal_links, height=200, key="internal_links")
255
-
256
- st.header("External Links")
257
- if 'external_links' not in st.session_state:
258
- st.session_state.external_links = ""
259
- st.text_area("Copy the external links here:", value=st.session_state.external_links, height=200, key="external_links")
260
-
261
- # عرض الصيغ
262
  st.header("File Extensions")
263
  if 'extensions_text' not in st.session_state:
264
  st.session_state.extensions_text = ""
 
37
  "unknown_params": []
38
  }
39
 
40
+ # قائمة لتحليل الصيغ (Extensions)
41
  extensions = {}
 
 
42
 
43
  # متغيرات للتحكم في العملية
44
  progress_bar = st.progress(0)
 
114
  score = result['scores'][0]
115
 
116
  if best_category == "shop" and score > 0.5:
117
+ param_categories["shop_params"].append(param)
118
  elif best_category == "game" and score > 0.5:
119
+ param_categories["game_params"].append(param)
120
  elif best_category == "stream" and score > 0.5:
121
+ param_categories["stream_params"].append(param)
122
  else:
123
+ param_categories["unknown_params"].append(param)
 
 
 
 
 
 
124
 
125
  # استخراج الصيغ (Extensions) من الروابط
126
  match = re.search(r'\.([a-zA-Z0-9]+)$', url)
127
  if match:
128
  ext = match.group(1)
129
  if ext not in extensions:
130
+ extensions[ext] = 0
131
+ extensions[ext] += 1
132
 
133
  # تحديث المؤشر الحالي
134
  current_index = i + batch_size
 
152
  st.session_state.unknown_text = "\n".join(unknown_items)
153
 
154
  # تحديث محتوى المربعات الخاصة بالباراميترات
155
+ st.session_state.shop_params = "\n".join(set(param_categories["shop_params"]))
156
+ st.session_state.game_params = "\n".join(set(param_categories["game_params"]))
157
+ st.session_state.stream_params = "\n".join(set(param_categories["stream_params"]))
158
+ st.session_state.unknown_params = "\n".join(set(param_categories["unknown_params"]))
 
 
 
 
159
 
160
+ # تحديث محتوى المربع الخاص بالصيغ
161
+ st.session_state.extensions_text = "\n".join(extensions.keys())
162
 
163
  # زر البدء
164
  if st.button("Start"):
 
235
  st.session_state.unknown_params = ""
236
  st.text_area("Copy the unknown parameters here:", value=st.session_state.unknown_params, height=200, key="unknown_params")
237
 
238
+ # عرض الصيغ (Extensions)
 
 
 
 
 
 
 
 
 
 
 
239
  st.header("File Extensions")
240
  if 'extensions_text' not in st.session_state:
241
  st.session_state.extensions_text = ""