Spaces:

tomaszki
/

visualize_attention

Sleeping

tomaszki commited on Oct 31, 2023

Commit

0f406af

1 Parent(s): 4920661

Added HF token for downloading Llama model

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,7 +9,11 @@ device = 'cuda' if torch.cuda.is_available() else 'cpu'
 @st.cache_resource
 def load_model():
-    return AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.bfloat16).to(device)
 @st.cache_resource
 def load_tokenizer():

 @st.cache_resource
 def load_model():
+    return AutoModelForCausalLM.from_pretrained(
+        model_name,
+        torch_dtype=torch.bfloat16,
+        token=st.secrets['hf_token']
+    ).to(device)
 @st.cache_resource
 def load_tokenizer():