Spaces:

hackergeek98
/

therpist2

Runtime error

hackergeek98 commited on Mar 21

Commit

d3cbad9

verified ·

1 Parent(s): 8dd9467

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,5 +1,23 @@
 from peft import PeftModel
-from transformers import AutoModelForCausalLM
 base_model = AutoModelForCausalLM.from_pretrained("google/gemma-3-1b-pt")
-model = PeftModel.from_pretrained(base_model, "hackergeek98/gemma-finetuned")

+import torch
 from peft import PeftModel
+from transformers import AutoModelForCausalLM, AutoTokenizer
+# Load tokenizer
+tokenizer = AutoTokenizer.from_pretrained("google/gemma-3-1b-pt")
+# Load base model on CPU
 base_model = AutoModelForCausalLM.from_pretrained("google/gemma-3-1b-pt")
+# Load fine-tuned PEFT model
+model = PeftModel.from_pretrained(base_model, "hackergeek98/gemma-finetuned")
+# Ensure model runs on CPU
+model = model.to("cpu")
+# Test inference
+input_text = "Hello, how are you?"
+input_ids = tokenizer(input_text, return_tensors="pt").input_ids.to("cpu")
+# Generate output
+output = model.generate(input_ids, max_length=50)
+print(tokenizer.decode(output[0], skip_special_tokens=True))