Spaces:

de-Rodrigo
/

saliencies

Running on Zero

App Files Files Community

de-Rodrigo commited on Sep 18, 2024

Commit

1dd7eb5

1 Parent(s): bbeae41

Modify to use Hugging Face ZeRO GPU

Browse files

Files changed (2) hide show

app.py +9 -10
requirements.txt +6 -3

app.py CHANGED Viewed

@@ -1,3 +1,4 @@
 import gradio as gr
 from huggingface_hub import list_models
 from typing import List
@@ -22,9 +23,7 @@ dataset = None
 def load_merit_dataset():
     global dataset
     if dataset is None:
-        dataset = load_dataset(
-            "de-Rodrigo/merit", name="en-digital-seq", split="train", num_proc=8
-        )
     return dataset
@@ -42,6 +41,7 @@ def get_collection_models(tag: str) -> List[str]:
     return [model.modelId for model in models if tag in model.tags]
 def get_donut():
     global donut_model, donut_processor
     if donut_model is None or donut_processor is None:
@@ -50,28 +50,26 @@ def get_donut():
                 "de-Rodrigo/donut-merit"
             )
             donut_processor = DonutProcessor.from_pretrained("de-Rodrigo/donut-merit")
-            if torch.cuda.is_available():
-                donut_model = donut_model.to("cuda")
-            logger.info("Donut model loaded successfully")
         except Exception as e:
             logger.error(f"Error loading Donut model: {str(e)}")
             raise
     return donut_model, donut_processor
 def process_image_donut(model, processor, image):
     try:
         if not isinstance(image, Image.Image):
             image = Image.fromarray(image)
-        pixel_values = processor(image, return_tensors="pt").pixel_values
-        if torch.cuda.is_available():
-            pixel_values = pixel_values.to("cuda")
         task_prompt = "<s_cord-v2>"
         decoder_input_ids = processor.tokenizer(
             task_prompt, add_special_tokens=False, return_tensors="pt"
-        )["input_ids"]
         outputs = model.generate(
             pixel_values,
@@ -99,6 +97,7 @@ def process_image_donut(model, processor, image):
         return f"Error: {str(e)}"
 def process_image(model_name, image=None, dataset_image_index=None):
     if dataset_image_index is not None:
         image = get_image_from_dataset(dataset_image_index)

+import spaces
 import gradio as gr
 from huggingface_hub import list_models
 from typing import List
 def load_merit_dataset():
     global dataset
     if dataset is None:
+        dataset = load_dataset("de-Rodrigo/merit", name="en-digital-seq", split="train")
     return dataset
     return [model.modelId for model in models if tag in model.tags]
+@spaces.GPU
 def get_donut():
     global donut_model, donut_processor
     if donut_model is None or donut_processor is None:
                 "de-Rodrigo/donut-merit"
             )
             donut_processor = DonutProcessor.from_pretrained("de-Rodrigo/donut-merit")
+            donut_model = donut_model.to("cuda")
+            logger.info("Donut model loaded successfully on GPU")
         except Exception as e:
             logger.error(f"Error loading Donut model: {str(e)}")
             raise
     return donut_model, donut_processor
+@spaces.GPU
 def process_image_donut(model, processor, image):
     try:
         if not isinstance(image, Image.Image):
             image = Image.fromarray(image)
+        pixel_values = processor(image, return_tensors="pt").pixel_values.to("cuda")
         task_prompt = "<s_cord-v2>"
         decoder_input_ids = processor.tokenizer(
             task_prompt, add_special_tokens=False, return_tensors="pt"
+        )["input_ids"].to("cuda")
         outputs = model.generate(
             pixel_values,
         return f"Error: {str(e)}"
+@spaces.GPU
 def process_image(model_name, image=None, dataset_image_index=None):
     if dataset_image_index is not None:
         image = get_image_from_dataset(dataset_image_index)

requirements.txt CHANGED Viewed

@@ -1,7 +1,10 @@
-gradio
 transformers
 huggingface_hub
-torch
 numpy
 Pillow
-datasets

+gradio>=4.0.0
 transformers
 huggingface_hub
+torch>=2.0.0,!=2.3.0,<2.5.0
 numpy
 Pillow
+datasets
+deepspeed
+huggingface-hub[cli,torch]
+huggingface_hub[spaces]