Spaces:

mdasad3617
/

lab-report-analyzer

Sleeping

mdasad3617 commited on Nov 30, 2024

Commit

ed4ebee

verified ·

1 Parent(s): 57cc735

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,7 +1,7 @@
 import streamlit as st
 from transformers import pipeline, VisionEncoderDecoderModel, ViTImageProcessor
 from PIL import Image
-import fitz
 import logging
 from concurrent.futures import ThreadPoolExecutor
 import torch
@@ -17,9 +17,9 @@ def setup_logging():
 @st.cache_resource
 def load_models():
     logging.info("Loading Hugging Face models...")
-    # Load image-to-text model from Hugging Face
-    processor = ViTImageProcessor.from_pretrained("microsoft/vision-transformation-transformer")
-    model = VisionEncoderDecoderModel.from_pretrained("microsoft/vision-transformation-transformer")
     # Load translation models
     translator_hi = pipeline("translation", model="Helsinki-NLP/opus-mt-en-hi")

 import streamlit as st
 from transformers import pipeline, VisionEncoderDecoderModel, ViTImageProcessor
 from PIL import Image
+import fitz  # PyMuPDF for PDF processing
 import logging
 from concurrent.futures import ThreadPoolExecutor
 import torch
 @st.cache_resource
 def load_models():
     logging.info("Loading Hugging Face models...")
+    # Use an alternative model from Hugging Face for image captioning
+    processor = ViTImageProcessor.from_pretrained("google/vit-base-patch16-224")
+    model = VisionEncoderDecoderModel.from_pretrained("google/vit-base-patch16-224")
     # Load translation models
     translator_hi = pipeline("translation", model="Helsinki-NLP/opus-mt-en-hi")