restapitrial_vectordb

Sleeping

Redmind commited on Feb 13

Commit

f081ce4

verified ·

1 Parent(s): 117bf92

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,6 +1,7 @@
 from fastapi import FastAPI
 import os
 import fitz  # PyMuPDF for PDFs
 from pptx import Presentation  # python-pptx for PowerPoint
 from sentence_transformers import SentenceTransformer  # Text embeddings
 import torch
@@ -49,7 +50,7 @@ def search(query: str):
 ### Step 1: Extract Text from PDF ###
 def extract_text_from_pdf(pdf_path):
     text = ""
-    doc = fitz.open(pdf_path)
     for page in doc:
         text += page.get_text() + "\n"
     return text.strip()

 from fastapi import FastAPI
 import os
 import fitz  # PyMuPDF for PDFs
+import pymupdf
 from pptx import Presentation  # python-pptx for PowerPoint
 from sentence_transformers import SentenceTransformer  # Text embeddings
 import torch
 ### Step 1: Extract Text from PDF ###
 def extract_text_from_pdf(pdf_path):
     text = ""
+    doc = pymupdf.open(pdf_path)
     for page in doc:
         text += page.get_text() + "\n"
     return text.strip()