Spaces:

harishnair04
/

MTChat

Runtime error

harishnair04 commited on about 15 hours ago

Commit

60b705d

•

1 Parent(s): 349753a

feat: faster cpu inference

Files changed (1) hide show

app.py CHANGED Viewed

@@ -44,6 +44,7 @@ model_id = "harishnair04/Gemma-medtr-2b-sft"
 # gemma_model = AutoModelForCausalLM.from_pretrained(model_id, gguf_file=filename)
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 gemma_model = AutoModelForCausalLM.from_pretrained(model_id)
 tokenizer.pad_token_id = tokenizer.eos_token_id

 # gemma_model = AutoModelForCausalLM.from_pretrained(model_id, gguf_file=filename)
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 gemma_model = AutoModelForCausalLM.from_pretrained(model_id)
+gemma_model.to_bettertransformer()
 tokenizer.pad_token_id = tokenizer.eos_token_id