Spaces:

Yerzhxn
/

test_space_new

Sleeping

App Files Files Community

Yerzhxn commited on Nov 21, 2024

Commit

55031b9

verified ·

1 Parent(s): e890e86

Update app.py

Browse files

Files changed (1) hide show

app.py +24 -54

app.py CHANGED Viewed

@@ -1,15 +1,6 @@
 import pandas as pd
 import streamlit as st
 # Загрузка данных из четырех Excel файлов
 vacancy = 'vacancy_new_new.xlsx'
@@ -23,8 +14,10 @@ df_nkz = pd.read_excel(file_nkz)
 df_skills = pd.read_excel(file_skills)
 # Проверка, что в файлах есть нужные колонки
-if 'skills' not in df_vacancy.columns or 'skills' not in df_resume.columns or 'name' not in df_vacancy.columns or 'name' not in df_resume.columns or 'NKZ' not in df_nkz.columns or 'skills' not in df_skills.columns:
-    raise ValueError("Файлы должны содержать колонки 'skills', 'name' и 'NKZ'")
 # Streamlit интерфейс
 st.title("Поиск совпадений по навыкам")
@@ -37,13 +30,12 @@ nkz_options = df_nkz['name'].unique().tolist()
 selected_nkz = st.selectbox("Выберите профессию по НКЗ", nkz_options)
 # Множественный выбор из колонки 'skills' из файла label_skills
-skills_options = sorted(df_skills[df_skills['NKZ'] == df_nkz[df_nkz['name'] == selected_nkz]['NKZ'].values[0]]['skills'].unique().tolist())
-selected_skills = st.multiselect("Выберите навыки", skills_options)
-if selected_skills:
-    selected_ids = df_skills[df_skills['skills'].isin(selected_skills)]['id'].tolist()
 else:
-    selected_ids = []
 # Выбор файла для поиска совпадений
 file_option = st.selectbox("Выберите тип", ("Вакансия", "Резюме"))
@@ -54,7 +46,7 @@ write_option = "resume" if file_option == "Вакансия" else "vacancy"
 add_entry = st.button("Добавить новую запись")
 if add_entry:
     if new_name and selected_skills:
-        new_entry = pd.DataFrame({'name': [new_name], 'NKZ': [selected_nkz], 'skills': [' '.join(selected_skills)]})
         if write_option == "vacancy":
             df_vacancy = pd.concat([df_vacancy, new_entry], ignore_index=True)
             df_vacancy.to_excel(vacancy, index=False)
@@ -67,51 +59,29 @@ if add_entry:
 if st.button("Найти совпадения"):
     if new_name and selected_skills:
-        # Добавление новой записи в противоположный файл
-        new_entry = pd.DataFrame({'name': [new_name], 'NKZ': [selected_nkz], 'skills': [' '.join(selected_skills)]})
-        if write_option == "vacancy":
-            df_vacancy = pd.concat([df_vacancy, new_entry], ignore_index=True)
-            df_vacancy.to_excel(vacancy, index=False)
-        else:
-            df_resume = pd.concat([df_resume, new_entry], ignore_index=True)
-            df_resume.to_excel(resume, index=False)
         # Определение DataFrame для поиска совпадений
         if file_option == "Вакансия":
-            ids_to_compare = df_vacancy['arr'].apply(lambda x: [int(i) for i in x.split(',') if i.strip().isdigit()]).tolist()
-            names_to_compare = df_vacancy['name'].tolist()
         else:
-            ids_to_compare = df_resume['arr'].apply(lambda x: [int(i) for i in x.split(',') if i.strip().isdigit()]).tolist()
-            names_to_compare = df_resume['name'].tolist()
         # Поиск совпадений по навыкам
         matching_results = []
-        for i, skills_text in enumerate(skills_to_compare):
-            match_count = sum(skill in skills_text for skill in selected_skills)
             if match_count >= len(selected_skills) / 2:
                 matching_results.append({
-                    'Name': names_to_compare[i],
-                    'Matching Skills': [skill for skill in selected_skills if skill in skills_text],
                     'Match Count': match_count
                 })
-        # Вывод результатов, где совпадение как минимум половины выбранных навыков
-        st.write("Результаты с совпадением как минимум половины выбранных навыков:")
-        matching_results = []
-        if selected_ids:
-            for i, ids_array in enumerate(ids_to_compare):
-                min_len = min(len(selected_ids), len(ids_array))
-                if min_len > 1:  # Для вычисления корреляции необходимо как минимум два элемента
-                    correlation = np.corrcoef(selected_ids[:min_len], ids_array[:min_len])[0, 1]
-                else:
-                    correlation = 0
-                if correlation > 0.5:
-                    matching_results.append({
-                        'Name': names_to_compare[i],
-                        'Correlation': correlation
-                    })
         else:
             st.write("Нет совпадений с как минимум половиной выбранных навыков.")
     else:
         st.error("Пожалуйста, введите имя и выберите навыки для сравнения.")

 import pandas as pd
 import streamlit as st
+import numpy as np
 # Загрузка данных из четырех Excel файлов
 vacancy = 'vacancy_new_new.xlsx'
 df_skills = pd.read_excel(file_skills)
 # Проверка, что в файлах есть нужные колонки
+required_columns = {'skills', 'name', 'NKZ'}
+for df, filename in zip([df_vacancy, df_resume, df_nkz, df_skills], [vacancy, resume, file_nkz, file_skills]):
+    if not required_columns.issubset(df.columns):
+        raise ValueError(f"Файл {filename} должен содержать колонки {required_columns}")
 # Streamlit интерфейс
 st.title("Поиск совпадений по навыкам")
 selected_nkz = st.selectbox("Выберите профессию по НКЗ", nkz_options)
 # Множественный выбор из колонки 'skills' из файла label_skills
+if selected_nkz:
+    skills_options = df_skills[df_skills['NKZ'] == df_nkz[df_nkz['name'] == selected_nkz]['NKZ'].values[0]]['skills'].unique().tolist()
+    selected_skills = st.multiselect("Выберите навыки", sorted(skills_options))
 else:
+    selected_skills = []
 # Выбор файла для поиска совпадений
 file_option = st.selectbox("Выберите тип", ("Вакансия", "Резюме"))
 add_entry = st.button("Добавить новую запись")
 if add_entry:
     if new_name and selected_skills:
+        new_entry = pd.DataFrame({'name': [new_name], 'NKZ': [selected_nkz], 'skills': [', '.join(selected_skills)]})
         if write_option == "vacancy":
             df_vacancy = pd.concat([df_vacancy, new_entry], ignore_index=True)
             df_vacancy.to_excel(vacancy, index=False)
 if st.button("Найти совпадения"):
     if new_name and selected_skills:
         # Определение DataFrame для поиска совпадений
         if file_option == "Вакансия":
+            df_to_compare = df_vacancy
         else:
+            df_to_compare = df_resume
         # Поиск совпадений по навыкам
         matching_results = []
+        for i, row in df_to_compare.iterrows():
+            existing_skills = row['skills'].split(', ')
+            match_count = sum(skill in existing_skills for skill in selected_skills)
             if match_count >= len(selected_skills) / 2:
                 matching_results.append({
+                    'Name': row['name'],
+                    'Matching Skills': [skill for skill in selected_skills if skill in existing_skills],
                     'Match Count': match_count
                 })
+        # Вывод результатов
+        if matching_results:
+            st.write("Результаты с совпадением как минимум половины выбранных навыков:")
+            st.write(pd.DataFrame(matching_results))
         else:
             st.write("Нет совпадений с как минимум половиной выбранных навыков.")
     else:
         st.error("Пожалуйста, введите имя и выберите навыки для сравнения.")