Spaces:

bryanmildort
/

gpt-notes-summarizer-demo

Paused

bryanmildort commited on Mar 27, 2023

Commit

eb0cb71

1 Parent(s): 61da180

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -20,9 +20,9 @@ device = "cuda:0" if torch.cuda.is_available() else "cpu"
 # device_map = infer_auto_device_map(model, dtype="float16")
 # st.write(device_map)
-@st.cache
 def load_model():
-    model = AutoModelForCausalLM.from_pretrained("bryanmildort/gpt_neo_notes", low_cpu_mem_usage=True, load_in_8bit=True)
     # model.to(device)
     tokenizer = AutoTokenizer.from_pretrained("bryanmildort/gpt_neo_notes")
     pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)

 # device_map = infer_auto_device_map(model, dtype="float16")
 # st.write(device_map)
+@st.cache(allow_output_mutation=True)
 def load_model():
+    model = AutoModelForCausalLM.from_pretrained("bryanmildort/gpt_neo_notes", low_cpu_mem_usage=True, load_in_8bit=True, device_map='auto')
     # model.to(device)
     tokenizer = AutoTokenizer.from_pretrained("bryanmildort/gpt_neo_notes")
     pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)