BhashiniSpace_Text_gemma

Runtime error

FlawedLLM commited on May 22, 2024

Commit

2e2a881

verified ·

1 Parent(s): 41aa4c4

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -46,13 +46,13 @@ import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
 tokenizer = AutoTokenizer.from_pretrained("FlawedLLM/Bhashini_9")
-quantization_config = BitsAndBytesConfig(
-        load_in_4bit=True,
-        bnb_4bit_use_double_quant=True,
-        bnb_4bit_quant_type="nf4",
-        bnb_4bit_compute_dtype=torch.float16)
 torch_dtype =torch.float16
-model = AutoModelForCausalLM.from_pretrained("FlawedLLM/Bhashini_9", device_map='auto',torch_dtype=torch_dtype, low_cpu_mem_usage=True, use_safetensors=True, quantization_config=quantization_config,)
 @spaces.GPU(duration=300)
 def chunk_it(input_command):

 from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
 tokenizer = AutoTokenizer.from_pretrained("FlawedLLM/Bhashini_9")
+# quantization_config = BitsAndBytesConfig(
+#         load_in_4bit=True,
+#         bnb_4bit_use_double_quant=True,
+#         bnb_4bit_quant_type="nf4",
+#         bnb_4bit_compute_dtype=torch.float16)
 torch_dtype =torch.float16
+model = AutoModelForCausalLM.from_pretrained("FlawedLLM/Bhashini_9",torch_dtype=torch_dtype, low_cpu_mem_usage=True, use_safetensors=True,)
 @spaces.GPU(duration=300)
 def chunk_it(input_command):