Spaces:

howard-hou
/

VisualRWKV-Gradio-1

Runtime error

howard-hou commited on Jan 8, 2024

Commit

f21d6cb

1 Parent(s): 818b0c6

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -221,19 +221,22 @@ def pil_image_to_base64(pil_image):
     return base64_image
 image_cache = {}
 def compute_image_state(image):
     base64_image = pil_image_to_base64(image)
     if base64_image in image_cache:
         image_state = image_cache[base64_image]
     else:
-        image = image_processor(images=image.convert('RGB'), return_tensors='pt')['pixel_values'].to(device)
         image_features = visual_encoder.encode_images(image.unsqueeze(0)).squeeze(0) # [L, D]
         # apply layer norm to image feature, very important
         image_features = F.layer_norm(image_features,
                                     (image_features.shape[-1],),
-                                    weight=model.w['blocks.0.ln0.weight'],
-                                    bias=model.w['blocks.0.ln0.bias'])
-        _, image_state = visual_rwkv.forward(embs=image_features, state=None)
         image_cache[base64_image] = image_state
     return image_state

     return base64_image
 image_cache = {}
+ln0_weight = model.w['blocks.0.ln0.weight'].to(torch.float32).to(device)
+ln0_bias = model.w['blocks.0.ln0.bias'].to(torch.float32).to(device)
 def compute_image_state(image):
     base64_image = pil_image_to_base64(image)
     if base64_image in image_cache:
         image_state = image_cache[base64_image]
     else:
+        image = image_processor(images=image.convert('RGB'), return_tensors='pt')['pixel_values']
+        image = image.to(device)
         image_features = visual_encoder.encode_images(image.unsqueeze(0)).squeeze(0) # [L, D]
         # apply layer norm to image feature, very important
         image_features = F.layer_norm(image_features,
                                     (image_features.shape[-1],),
+                                    weight=ln0_weight,
+                                    bias=ln0_bias)
+        _, image_state = model.forward(embs=image_features, state=None)
         image_cache[base64_image] = image_state
     return image_state