Spaces:

manasvinid
/

RESUME_RANKER

Sleeping

App Files Files Community

manasvinid commited on Feb 28, 2024

Commit

50e0a7b

verified ·

1 Parent(s): 5a25f5f

Update functions.py

Browse files

Files changed (1) hide show

functions.py +54 -53

functions.py CHANGED Viewed

@@ -385,79 +385,80 @@ class QdrantInterface:
-def resume_pdf():
-    # File uploader widget
-    uploaded_file = st.file_uploader("Upload Resumes", type=["pdf"])
-    if uploaded_file is not None:
-        # Read PDF file
-        pdf_reader = PyPDF2.PdfReader(uploaded_file)
         num_pages = len(pdf_reader.pages)
-        # Extract text from each page
-        text = ""
         for page_num in range(num_pages):
             page = pdf_reader.pages[page_num]
             text += page.extract_text()
-        # Convert text to CSV
-        csv_data = convert_to_csv(text)
-        # Display or download CSV
-        st.subheader("Converted CSV Data")
-        st.write(csv_data)
-        # Download link for CSV file
-        st.download_button(
-            label="Download CSV",
-            data=csv_data,
-            file_name="converted_data.csv",
-            mime="text/csv"
-        )
-def job_desc_pdf():
-    # File uploader widget
-    uploaded_file = st.file_uploader("Upload Job Description", type=["pdf"])
-    if uploaded_file is not None:
-        # Read PDF file
-        pdf_reader = PyPDF2.PdfReader(uploaded_file)
-        num_pages = len(pdf_reader.pages)
-        # Extract text from each page
-        text = ""
-        for page_num in range(num_pages):
-            page = pdf_reader.pages[page_num]
-            text += page.extract_text()
-        # Convert text to CSV
-        csv_data = convert_to_csv(text)
-        # Display or download CSV
-        st.subheader("Converted CSV Data")
-        st.write(csv_data)
-        # Download link for CSV file
-        st.download_button(
-            label="Download CSV",
-            data=csv_data,
-            file_name="converted_data.csv",
-            mime="text/csv"
-        )
-def convert_to_csv(text):
-    # Split text into lines and create a DataFrame
-    lines = text.split("\n")
-    df = pd.DataFrame(lines, columns=["Text"])
-    # Convert DataFrame to CSV format
-    csv_data = df.to_csv(index=False, escapechar='\\')
-    return csv_data

+def extract_text_from_pdf(file):
+    """
+    Extract text from a PDF file using PyPDF2 library.
+    """
+    text = ""
+    try:
+        pdf_reader = PyPDF2.PdfReader(file)
         num_pages = len(pdf_reader.pages)
         for page_num in range(num_pages):
             page = pdf_reader.pages[page_num]
             text += page.extract_text()
+    except Exception as e:
+        st.error(f"Error extracting text from PDF: {e}")
+    return text
+def resume_pdf():
+    st.title(UPLOAD RESUMES")
+    # Allow user to upload multiple PDF files
+    uploaded_files = st.file_uploader("Upload PDF files", type="pdf")
+    if uploaded_files:
+        st.write("## Extracted Text from PDFs")
+        df_rows = []
+        # Iterate over uploaded PDF files
+        for uploaded_file in uploaded_files:
+            text = extract_text_from_pdf(uploaded_file)
+            # Add text to DataFrame
+            df_rows.append({"File Name": uploaded_file.name, "Text": text})
+            # Display extracted text
+            st.write(f"### {uploaded_file.name}")
+            st.write(text)
+        # Create DataFrame
+        df = pd.DataFrame(df_rows)
+        # Display DataFrame
+        st.write("## Combined Data in DataFrame")
+        st.write(df)
+def job_desc_pdf():
+    st.title(UPLOAD JOB DESCRIPTION")
+    # Allow user to upload multiple PDF files
+    uploaded_files = st.file_uploader("Upload PDF files", accept_multiple_files=True, type="pdf")
+    if uploaded_files:
+        st.write("## Extracted Text from PDFs")
+        df_rows = []
+        # # Iterate over uploaded PDF files
+        # for uploaded_file in uploaded_files:
+        #     text = extract_text_from_pdf(uploaded_file)
+        #     # Add text to DataFrame
+        #     df_rows.append({"File Name": uploaded_file.name, "Text": text})
+        #     # Display extracted text
+        #     st.write(f"### {uploaded_file.name}")
+        #     st.write(text)
+        # Create DataFrame
+        df = pd.DataFrame(df_rows)
+        # Display DataFrame
+        st.write("## Combined Data in DataFrame")
+        st.write(df)