Spaces:

jacob-c
/

Resume_Screener_and_Skill_Extractor

Paused

root commited on Feb 6

Commit

08f9d0b

1 Parent(s): 487c4a2

sss

Files changed (2) hide show

app.py CHANGED Viewed

@@ -1,5 +1,5 @@
 import streamlit as st
-import PyPDF2
 import io
 import spacy
 from docx import Document
@@ -41,10 +41,10 @@ job_descriptions = {
 }
 def extract_text_from_pdf(pdf_file):
-    pdf_reader = PyPDF2.PdfReader(pdf_file)
     text = ""
-    for page in pdf_reader.pages:
-        text += page.extract_text()
     return text
 def extract_text_from_docx(docx_file):

 import streamlit as st
+import pdfplumber
 import io
 import spacy
 from docx import Document
 }
 def extract_text_from_pdf(pdf_file):
     text = ""
+    with pdfplumber.open(pdf_file) as pdf:
+        for page in pdf.pages:
+            text += page.extract_text() or ""
     return text
 def extract_text_from_docx(docx_file):

requirements.txt CHANGED Viewed

@@ -1,5 +1,5 @@
 streamlit>=1.31.0
-PyPDF2>=3.0.1
 python-docx>=1.1.0
 transformers>=4.37.2
 spacy>=3.7.2

 streamlit>=1.31.0
+pdfplumber>=0.10.3
 python-docx>=1.1.0
 transformers>=4.37.2
 spacy>=3.7.2