Spaces:

NourFakih
/

Video_Captioning_01

Running

NourFakih commited on Jul 8, 2024

Commit

ab81e75

verified ·

1 Parent(s): 3b947d3

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,7 +3,7 @@ import os
 import cv2
 import pandas as pd
 from PIL import Image
-from transformers import VisionEncoderDecoderModel, ViTFeatureExtractor, AutoTokenizer, pipeline, AutoModelForSeq2SeqLM
 import nltk
 import tempfile
 import zipfile
@@ -14,7 +14,7 @@ nltk.download('omw-1.4')
 # Load the pre-trained models for image captioning and summarization
 model_name = "NourFakih/Vit-GPT2-COCO2017Flickr-85k-09"
 model = VisionEncoderDecoderModel.from_pretrained(model_name)
-feature_extractor = ViTFeatureExtractor.from_pretrained(model_name)
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model_sum_name = "google-t5/t5-base"

 import cv2
 import pandas as pd
 from PIL import Image
+from transformers import VisionEncoderDecoderModel, ViTImageProcessor, AutoTokenizer, pipeline, AutoModelForSeq2SeqLM
 import nltk
 import tempfile
 import zipfile
 # Load the pre-trained models for image captioning and summarization
 model_name = "NourFakih/Vit-GPT2-COCO2017Flickr-85k-09"
 model = VisionEncoderDecoderModel.from_pretrained(model_name)
+feature_extractor = ViTImageProcessor.from_pretrained(model_name)
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model_sum_name = "google-t5/t5-base"