Spaces:

Vaibhav84
/

ResumeAPI

Sleeping

Vaibhav84 commited on Apr 29, 2024

Commit

b271292

1 Parent(s): 11e22b7

Changes

Files changed (1) hide show

ExtractContentsFromFile.py CHANGED Viewed

@@ -9,17 +9,24 @@ warnings.filterwarnings('ignore')
 class ExtractContentFromFile:
     def ExtractDataFromFile(FileName,file):
         text =''
-        #print(text)
-        if FileName.endswith("pdf"):
-            reserve_pdf_on_memory = io.BytesIO(file)
-            load_pdf = PyPDF2.PdfReader(reserve_pdf_on_memory)
-            for page in load_pdf.pages:
-                text += page.extract_text()
-        elif FileName.endswith("doc") or FileName.endswith("docx"):
-            text = docx2txt.process(file)
-            text = text.read()
-        else:
-            text = file.decode('utf-8')
         return text

 class ExtractContentFromFile:
     def ExtractDataFromFile(FileName,file):
         text =''
+        try:
+            #print(text)
+            if FileName.endswith("pdf"):
+                reserve_pdf_on_memory = io.BytesIO(file)
+                load_pdf = PyPDF2.PdfReader(reserve_pdf_on_memory)
+                for page in load_pdf.pages:
+                    text += page.extract_text()
+            elif FileName.endswith("doc") or FileName.endswith("docx"):
+                text = docx2txt.process(file)
+                text = text.read()
+            else:
+                text = file.decode('utf-8')
+        except:
+            print("Error reading file")
+        finally:
+            # Close the resources to free up memory
+            del reserve_pdf_on_memory
+            del load_pdf
         return text