Spaces:

samyak152002
/

texmetrics-regex-checks-gradio-1

Sleeping

samyak152002 commited on Mar 9

Commit

09c8002

verified ·

1 Parent(s): 364e0ba

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -39,7 +39,7 @@ def extract_pdf_text(file) -> str:
             words = page.get_text("word")
             full_text += words
-        print(full_text)
         doc.close()
         print(f"Total extracted text length: {len(full_text)} characters.")
         return full_text
@@ -264,7 +264,7 @@ def highlight_issues_in_pdf(file, language_matches: List[Dict[str, Any]]) -> byt
         abstract_offset = 0 if abstract_start == -1 else abstract_start
         # Find "References" section and exclude from processing
-        references_start = concatenated_text.lower().find("references")
         references_offset = len(concatenated_text) if references_start == -1 else references_start
         # Iterate over each language issue
@@ -473,4 +473,3 @@ if __name__ == "__main__":
         server_port=None
     )

             words = page.get_text("word")
             full_text += words
+        # print(full_text)
         doc.close()
         print(f"Total extracted text length: {len(full_text)} characters.")
         return full_text
         abstract_offset = 0 if abstract_start == -1 else abstract_start
         # Find "References" section and exclude from processing
+        references_start = concatenated_text.lower().rfind("references")
         references_offset = len(concatenated_text) if references_start == -1 else references_start
         # Iterate over each language issue
         server_port=None
     )