Spaces:

peterpeter8585
/

SungYoon_AI2

Sleeping

peterpeter8585 commited on Nov 22, 2024

Commit

85c868d

verified ·

1 Parent(s): 5b312c9

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,7 +1,7 @@
 import os
 import torch
-from transformers import AutoModelForCausalLM as m, AutoTokenizer as t, GPTQConfig as quant
-qq=quant(bits=4, exllama_config={"version":2})
 mod=m.from_pretrained("peterpeter8585/sungyoonaimodel2", quantization_config=qq)
 tok=t.from_pretrained("peterpeter8585/sungyoonaimodel2", trust_remote_code=True)
 mod.eval()

 import os
 import torch
+from transformers import AutoModelForCausalLM as m, AutoTokenizer as t, BitsAndBytesConfig as quant
+qq=quant(load_in_8bit=True)
 mod=m.from_pretrained("peterpeter8585/sungyoonaimodel2", quantization_config=qq)
 tok=t.from_pretrained("peterpeter8585/sungyoonaimodel2", trust_remote_code=True)
 mod.eval()