Spaces:

Navid-AI
/

Yehia-7B-preview

Running on Zero

MohamedRashad commited on Jan 17

Commit

e769375

verified ·

1 Parent(s): 9e39b36

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,7 +10,7 @@ from threading import Thread
 # Load model directly
 device = "cuda" if torch.cuda.is_available() else "cpu"
 tokenizer = AutoTokenizer.from_pretrained("Navid-AI/Mulhem-1-Mini", token=os.getenv("HF_TOKEN"))
-model = AutoModelForCausalLM.from_pretrained("Navid-AI/Mulhem-1-Mini", torch_dtype=torch.bfloat16, attn_implementation="flash_attention_2", token=os.getenv("HF_TOKEN")).to(device)
 streamer = TextIteratorStreamer(tokenizer, skip_prompt=True)
 def respond(

 # Load model directly
 device = "cuda" if torch.cuda.is_available() else "cpu"
 tokenizer = AutoTokenizer.from_pretrained("Navid-AI/Mulhem-1-Mini", token=os.getenv("HF_TOKEN"))
+model = AutoModelForCausalLM.from_pretrained("Navid-AI/Mulhem-1-Mini", torch_dtype=torch.bfloat16, token=os.getenv("HF_TOKEN")).to(device)
 streamer = TextIteratorStreamer(tokenizer, skip_prompt=True)
 def respond(