ScientryAPI

Running

raannakasturi commited on Dec 22, 2024

Commit

c7c6bac

verified ·

1 Parent(s): b8aa173

Update extract_text.py

Files changed (1) hide show

extract_text.py CHANGED Viewed

@@ -31,9 +31,7 @@ def extract_text_from_pdf(url, id):
             relevant_text = all_text[start_index:end_index]
         else:
             relevant_text = all_text
-        text_splitter = RecursiveCharacterTextSplitter(chunk_size=250, chunk_overlap=50)
-        text_list = text_splitter.split_text(relevant_text)
-        research_paper_text = "".join(text_list)
     except Exception as e:
         print(f"Error processing PDF: {e}")
         research_paper_text = ""

             relevant_text = all_text[start_index:end_index]
         else:
             relevant_text = all_text
+        research_paper_text = relevant_text
     except Exception as e:
         print(f"Error processing PDF: {e}")
         research_paper_text = ""