Spaces:

KoonJamesZ
/

ccib-qwen

Sleeping

KoonJamesZ commited on Dec 17, 2024

Commit

886676d

verified ·

1 Parent(s): f713678

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,30 +4,28 @@ import torch
 import uuid
 from moviepy.editor import VideoFileClip
 import os
-import torch
 from transformers import AutoModelForSpeechSeq2Seq, AutoProcessor, pipeline
 import cv2
 from ultralytics import YOLO
 from heapq import heappush, heappushpop
 import numpy as np
 import uuid
-import uuid
 from ultralytics import YOLO
 import gradio as gr
-# # default: Load the model on the available device(s)
-# model = Qwen2VLForConditionalGeneration.from_pretrained(
-#     "Qwen/Qwen2-VL-7B-Instruct", torch_dtype="auto", device_map="auto"
-# )
-#8-bit quantization
 model = Qwen2VLForConditionalGeneration.from_pretrained(
-    "Qwen/Qwen2-VL-7B-Instruct",
-    torch_dtype=torch.float16,
-    load_in_8bit=True,  # Use 8-bit quantization
-    device_map="auto",
 )
 # We recommend enabling flash_attention_2 for better acceleration and memory saving, especially in multi-image and video scenarios.
 # model = Qwen2VLForConditionalGeneration.from_pretrained(

 import uuid
 from moviepy.editor import VideoFileClip
 import os
 from transformers import AutoModelForSpeechSeq2Seq, AutoProcessor, pipeline
 import cv2
 from ultralytics import YOLO
 from heapq import heappush, heappushpop
 import numpy as np
 import uuid
 from ultralytics import YOLO
 import gradio as gr
+# default: Load the model on the available device(s)
 model = Qwen2VLForConditionalGeneration.from_pretrained(
+    "Qwen/Qwen2-VL-7B-Instruct", torch_dtype="auto", device_map="auto"
 )
+# #8-bit quantization
+# model = Qwen2VLForConditionalGeneration.from_pretrained(
+#     "Qwen/Qwen2-VL-7B-Instruct",
+#     torch_dtype=torch.float16,
+#     load_in_8bit=True,  # Use 8-bit quantization
+#     device_map="auto",
+# )
 # We recommend enabling flash_attention_2 for better acceleration and memory saving, especially in multi-image and video scenarios.
 # model = Qwen2VLForConditionalGeneration.from_pretrained(