Spaces:

dar-tau
/

run_inference

Sleeping

dar-tau commited on Jun 8, 2024

Commit

7eb4c2f

verified ·

1 Parent(s): 2b202a1

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -57,12 +57,14 @@ start_messages = [
 # past_key_values = PastKV()
 def past_kv_to_device(past_kv, device):
-    return tuple((k.to(device).detach(), v.to(device).detach()) for k, v in past_kv)
 def detach_past_kv(past_kv):
     return tuple((k.cpu().detach().numpy().tolist(), v.cpu().detach().numpy().tolist()) for k, v in past_kv)
 @spaces.GPU
 def set_past_key_values():
     model, tokenizer = pipe.model, pipe.tokenizer
@@ -91,6 +93,6 @@ if __name__ == "__main__":
     with torch.no_grad():
         past_key_values = set_past_key_values()
         print(f'{past_key_values=}')
-        demo = gr.Interface(generate,
-                            inputs=["textbox", gr.State(past_key_values)], outputs="textbox")
         demo.launch()

 # past_key_values = PastKV()
 def past_kv_to_device(past_kv, device):
+    return tuple((torch.tensor(k).to(device).detach(), torch.tensor(v).to(device).detach()) for k, v in past_kv)
 def detach_past_kv(past_kv):
     return tuple((k.cpu().detach().numpy().tolist(), v.cpu().detach().numpy().tolist()) for k, v in past_kv)
 @spaces.GPU
 def set_past_key_values():
     model, tokenizer = pipe.model, pipe.tokenizer
     with torch.no_grad():
         past_key_values = set_past_key_values()
         print(f'{past_key_values=}')
+        demo = gr.Interface(partial(generate, past_key_values=past_kv_to_device(past_key_values, pipe.model.device)),
+                            inputs="textbox", outputs="textbox")
         demo.launch()