Spaces:

slabstech
/

dhwani-internal-api-server

Sleeping

sachin commited on 21 days ago

Commit

f4d05d5

1 Parent(s): 6173695

temp-disable quantisation

Files changed (1) hide show

src/server/gemma_llm.py CHANGED Viewed

@@ -39,7 +39,7 @@ class LLMManager:
                 self.model = Gemma3ForConditionalGeneration.from_pretrained(
                     self.model_name,
                     device_map="auto",
-                    quantization_config=quantization_config,
                     torch_dtype=self.torch_dtype
                 ).eval()
                 self.processor = AutoProcessor.from_pretrained(self.model_name)

                 self.model = Gemma3ForConditionalGeneration.from_pretrained(
                     self.model_name,
                     device_map="auto",
+                    #quantization_config=quantization_config,
                     torch_dtype=self.torch_dtype
                 ).eval()
                 self.processor = AutoProcessor.from_pretrained(self.model_name)