Spaces:

manasvinid
/

RESUME_RANKER

Sleeping

App Files Files Community

manasvinid commited on Feb 29, 2024

Commit

6d0f67b

verified ·

1 Parent(s): 96d38bc

Update app.py

Browse files

Files changed (1) hide show

app.py +26 -1

app.py CHANGED Viewed

@@ -82,6 +82,9 @@ jobs_data_summarized = batch_summarize(jobs_data_final, 'processed_description',
 # Summarize all 'processed_resume' in resume_data_final
 resume_data_summarized = batch_summarize(resume_data_final, 'processed_resume', summarizer, batch_size=10, output_col='summarized_resume')
 # Example Usage
 encoder = SentenceTransformerEncoder(model_name='all-MiniLM-L6-v2')
@@ -92,6 +95,9 @@ jobs_data_summarized_and_encoded = encoder.encode_column(jobs_data_summarized, '
 # Encoding the summarized resumes
 resume_data_summarized_and_encoded = encoder.encode_column(resume_data_summarized, 'summarized_resume')
 # Combine the jobs data
 jobs_combined = pd.merge(
@@ -110,6 +116,11 @@ jobs_combined.reset_index(drop=True, inplace=True)
 resume_combined.reset_index(drop=True, inplace=True)
 #QDRANT VECTORIZER
 vector_dimension = encoder.model.get_sentence_embedding_dimension()
@@ -126,6 +137,12 @@ def ensure_list_format(df, vector_col):
 jobs_combined = ensure_list_format(jobs_combined, 'summarized_description_encoded')
 resume_combined = ensure_list_format(resume_combined, 'summarized_resume_encoded')
 given_job_vector = jobs_combined['summarized_description_encoded'].iloc[0]
 # Now upload to Qdrant
@@ -135,10 +152,18 @@ qdrant_interface.save_to_qdrant(resume_combined, 'resumes', 'summarized_resume_e
 # Retrieve specific records by IDs from the 'jobs' collection
 specific_jobs_records = qdrant_interface.retrieve_specific_records('jobs', ids=[1])
 # Find top 5 matching resumes for the example job
 matched_resumes = qdrant_interface.match_jobs_to_resumes(given_job_vector, top_k=5)
 for resume, score in matched_resumes:
-    print(f"Matched Resume: {resume['summarized_resume']}, Score: {score}")

 # Summarize all 'processed_resume' in resume_data_final
 resume_data_summarized = batch_summarize(resume_data_final, 'processed_resume', summarizer, batch_size=10, output_col='summarized_resume')
+st.write("SUMMARISED")
+st.write(jobs_data_summarized)
+st.write(resume_data_summarized)
 # Example Usage
 encoder = SentenceTransformerEncoder(model_name='all-MiniLM-L6-v2')
 # Encoding the summarized resumes
 resume_data_summarized_and_encoded = encoder.encode_column(resume_data_summarized, 'summarized_resume')
+st.write("SUMMARISED AND ENCODED")
+st.write(jobs_data_summarized_and_encoded)
+st.write(resume_data_summarized_and_encoded)
 # Combine the jobs data
 jobs_combined = pd.merge(
 resume_combined.reset_index(drop=True, inplace=True)
+st.write("SUMMARISED AND ENCODED")
+st.write(jobs_combined)
+st.write(resume_combined)
 #QDRANT VECTORIZER
 vector_dimension = encoder.model.get_sentence_embedding_dimension()
 jobs_combined = ensure_list_format(jobs_combined, 'summarized_description_encoded')
 resume_combined = ensure_list_format(resume_combined, 'summarized_resume_encoded')
+st.write("LIST FORMAT")
+st.write(jobs_combined)
+st.write(resume_combined)
 given_job_vector = jobs_combined['summarized_description_encoded'].iloc[0]
 # Now upload to Qdrant
 # Retrieve specific records by IDs from the 'jobs' collection
 specific_jobs_records = qdrant_interface.retrieve_specific_records('jobs', ids=[1])
+st.write("SPECIFIC JOB RECS")
+st.write(specific_jobs_records)
 # Find top 5 matching resumes for the example job
 matched_resumes = qdrant_interface.match_jobs_to_resumes(given_job_vector, top_k=5)
 for resume, score in matched_resumes:
+    st.write(f"Matched Resume: {resume['summarized_resume']}, Score: {score}")