File size: 5,585 Bytes
561c472
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
import pandas as pd
import streamlit as st

# Загрузка данных из четырех Excel файлов
vacancy = 'vacancy_new_new.xlsx'
resume = 'resume_new_new.xlsx'
file_nkz = 'label_NKZ.xlsx'
file_skills = 'label_skills.xlsx'

df_vacancy = pd.read_excel(vacancy)
df_resume = pd.read_excel(resume)
df_nkz = pd.read_excel(file_nkz)
df_skills = pd.read_excel(file_skills)

# Проверка, что в файлах есть нужные колонки
if 'skills' not in df_vacancy.columns or 'skills' not in df_resume.columns or 'name' not in df_vacancy.columns or 'name' not in df_resume.columns or 'NKZ' not in df_nkz.columns or 'skills' not in df_skills.columns:
    raise ValueError("Файлы должны содержать колонки 'skills', 'name' и 'NKZ'")

# Streamlit интерфейс
st.title("Поиск совпадений по навыкам")

# Ввод текста для добавления в колонку 'name'
new_name = st.text_input("Введите название")

# Выбор из колонки 'NKZ' из файла label_NKZ
nkz_options = df_nkz['name'].unique().tolist()
selected_nkz = st.selectbox("Выберите профессию по НКЗ", nkz_options)

# Множественный выбор из колонки 'skills' из файла label_skills
skills_options = sorted(df_skills[df_skills['NKZ'] == df_nkz[df_nkz['name'] == selected_nkz]['NKZ'].values[0]]['skills'].unique().tolist())

selected_skills = st.multiselect("Выберите навыки", skills_options)

# Выбор файла для поиска совпадений
file_option = st.selectbox("Выберите тип", ("Вакансия", "Резюме"))

# Выбор файла для записи новой записи
write_option = "resume" if file_option == "Вакансия" else "vacancy"

# Кнопки для добавления новой записи и запуска поиска совпадений
add_entry = st.button("Добавить новую запись")
if add_entry:
    if new_name and selected_skills:
        new_entry = pd.DataFrame({'name': [new_name], 'NKZ': [selected_nkz], 'skills': [' '.join(selected_skills)]})
        if write_option == "vacancy":
            df_vacancy = pd.concat([df_vacancy, new_entry], ignore_index=True)
            df_vacancy.to_excel(vacancy, index=False)
        else:
            df_resume = pd.concat([df_resume, new_entry], ignore_index=True)
            df_resume.to_excel(resume, index=False)
        st.success("Новая запись была успешно добавлена.")
    else:
        st.error("Пожалуйста, введите имя и выберите навыки для добавления записи.")

if st.button("Найти совпадения"):
    if new_name and selected_skills:
        # Добавление новой записи в противоположный файл
        new_entry = pd.DataFrame({'name': [new_name], 'NKZ': [selected_nkz], 'skills': [' '.join(selected_skills)]})
        if write_option == "vacancy":
            df_vacancy = pd.concat([df_vacancy, new_entry], ignore_index=True)
            df_vacancy.to_excel(vacancy, index=False)
        else:
            df_resume = pd.concat([df_resume, new_entry], ignore_index=True)
            df_resume.to_excel(resume, index=False)
        
        # Определение DataFrame для поиска совпадений
        if file_option == "Вакансия":
            skills_to_compare = df_vacancy['skills'].tolist()
            names_to_compare = df_vacancy['name'].tolist()
        else:
            skills_to_compare = df_resume['skills'].tolist()
            names_to_compare = df_resume['name'].tolist()
        
        # Поиск совпадений по навыкам
        matching_results = []
        for i, skills_text in enumerate(skills_to_compare):
            match_count = sum(skill in skills_text for skill in selected_skills)
            if match_count >= len(selected_skills) / 2:
                matching_results.append({
                    'Name': names_to_compare[i],
                    'Matching Skills': [skill for skill in selected_skills if skill in skills_text],
                    'Match Count': match_count
                })
        
        # Вывод результатов, где совпадение как минимум половины выбранных навыков
        st.write("Результаты с совпадением как минимум половины выбранных навыков:")
        if matching_results:
            for result in matching_results:
                st.markdown(
                f"""
                <div style="border: 1px solid #ddd; padding: 10px; border-radius: 5px; margin-bottom: 10px;">
                    <h4 style="margin: 0;">{result['Name']}</h4>
                    <p><strong>Совпадающие навыки:</strong><br>
                    {'<br>'.join(['• ' + skill for skill in result['Matching Skills']])}</p>
                    <p><strong>Количество совпадений:</strong> {result['Match Count']}</p>
                </div>
                """,
                unsafe_allow_html=True
                )
        else:
            st.write("Нет совпадений с как минимум половиной выбранных навыков.")
    else:
        st.error("Пожалуйста, введите имя и выберите навыки для сравнения.")