Spaces:

Sephfox
/

Cain

Running

Sephfox commited on Mar 28

Commit

dd1aea5

verified ·

1 Parent(s): e67a430

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -111,8 +111,9 @@ class LLMResponder:
             self.llm = Llama(model_path="path/to/your/gguf/file.gguf", n_ctx=1024)
             self.backend = "llama_cpp"
         else:
-            self.llm_tokenizer = AutoTokenizer.from_pretrained(model_name)
-            self.llm_model = AutoModelForCausalLM.from_pretrained(model_name)
             self.backend = "transformers"
     def generate_response(self, prompt):
@@ -189,4 +190,5 @@ iface = gr.Interface(
 )
 if __name__ == "__main__":
-    iface.launch(share=True)

             self.llm = Llama(model_path="path/to/your/gguf/file.gguf", n_ctx=1024)
             self.backend = "llama_cpp"
         else:
+            # Use trust_remote_code=True to load the model despite missing config keys.
+            self.llm_tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
+            self.llm_model = AutoModelForCausalLM.from_pretrained(model_name, trust_remote_code=True)
             self.backend = "transformers"
     def generate_response(self, prompt):
 )
 if __name__ == "__main__":
+    # In Hugging Face Spaces, remove share=True.
+    iface.launch()