Spaces:

fruitpicker01
/

Test_Pipeline_dev_2

Sleeping

App Files Files Community

fruitpicker01 commited on Sep 23, 2024

Commit

78eacd5

verified ·

1 Parent(s): 116494f

Update app.py

Browse files

Files changed (1) hide show

app.py +28 -4

app.py CHANGED Viewed

@@ -697,6 +697,7 @@ def load_previous_user_request_from_github():
 def get_reference_message(current_description, gender, generation, psychotype, business_stage, industry, legal_form):
     import io
     repo = "fruitpicker01/Storage_dev"
     file_path = "messages.csv"
     url = f"https://api.github.com/repos/{repo}/contents/{file_path}"
@@ -746,7 +747,7 @@ def get_reference_message(current_description, gender, generation, psychotype, b
         print("Сообщения с заданными параметрами не найдены.")
         return None
-    # Проверяем, что колонка 'Описание предложения' существует
     if 'Описание предложения' not in filtered_df.columns:
         print("Описание предложения отсутствует в данных.")
         return None
@@ -763,14 +764,37 @@ def get_reference_message(current_description, gender, generation, psychotype, b
     tfidf_matrix = vectorizer.fit_transform(descriptions)
     cosine_similarities = cosine_similarity(tfidf_matrix[0:1], tfidf_matrix[1:]).flatten()
-    # Находим индекс сообщения с наибольшим сходством
-    most_similar_idx = cosine_similarities.argmax()
-    similar_row = filtered_df.iloc[most_similar_idx]
     if pd.notnull(similar_row.get("Откорректированное сообщение", None)) and similar_row["Откорректированное сообщение"].strip():
         reference_message = similar_row["Откорректированное сообщение"]
     else:
         reference_message = similar_row.get("Персонализированное сообщение", "")
     reference_message = re.sub(r'\n-{6,}\nКоличество знаков: \d+', '', reference_message).strip()
     return reference_message

 def get_reference_message(current_description, gender, generation, psychotype, business_stage, industry, legal_form):
     import io
+    import numpy as np  # Убедитесь, что NumPy импортирован
     repo = "fruitpicker01/Storage_dev"
     file_path = "messages.csv"
     url = f"https://api.github.com/repos/{repo}/contents/{file_path}"
         print("Сообщения с заданными параметрами не найдены.")
         return None
+    # Проверяем наличие столбца 'Описание предложения'
     if 'Описание предложения' not in filtered_df.columns:
         print("Описание предложения отсутствует в данных.")
         return None
     tfidf_matrix = vectorizer.fit_transform(descriptions)
     cosine_similarities = cosine_similarity(tfidf_matrix[0:1], tfidf_matrix[1:]).flatten()
+    # Находим максимальное косинусное сходство
+    max_similarity = cosine_similarities.max()
+    # Находим индексы, где косинусное сходство равно максимальному
+    max_similarity_indices = np.where(cosine_similarities == max_similarity)[0]
+    # Получаем строки с максимальным сходством
+    similar_rows = filtered_df.iloc[max_similarity_indices]
+    # Проверяем наличие столбца 'Timestamp'
+    if 'Timestamp' not in similar_rows.columns:
+        print("Столбец 'Timestamp' отсутствует в данных.")
+        # Если нет 'Timestamp', выбираем первую строку
+        similar_row = similar_rows.iloc[0]
+    else:
+        # Создаем копию DataFrame, чтобы избежать предупреждений
+        similar_rows = similar_rows.copy()
+        # Преобразуем 'Timestamp' в числовой формат (предполагая, что это UNIX-время)
+        similar_rows['Timestamp'] = pd.to_numeric(similar_rows['Timestamp'], errors='coerce')
+        # Сортируем строки по 'Timestamp' в порядке убывания
+        similar_rows = similar_rows.sort_values(by='Timestamp', ascending=False)
+        # Выбираем первую строку (с самым новым 'Timestamp')
+        similar_row = similar_rows.iloc[0]
     if pd.notnull(similar_row.get("Откорректированное сообщение", None)) and similar_row["Откорректированное сообщение"].strip():
         reference_message = similar_row["Откорректированное сообщение"]
     else:
         reference_message = similar_row.get("Персонализированное сообщение", "")
     reference_message = re.sub(r'\n-{6,}\nКоличество знаков: \d+', '', reference_message).strip()
     return reference_message