Spaces:

lab2-as
/

lab2-ui

Sleeping

MyNameIsSimon commited on Dec 8, 2024

Commit

4470c09

1 Parent(s): dacd0e3

fixed model loading

Files changed (2) hide show

app.py CHANGED Viewed

@@ -4,7 +4,8 @@ os.environ["CUDA_VISIBLE_DEVICES"] = ""
 import gradio as gr
 #from unsloth import FastLanguageModel
-from transformers import TextIteratorStreamer, AutoModelForCausalLM, AutoTokenizer
 from threading import Thread
 """
@@ -37,7 +38,7 @@ class MyModel:
             # )
             # FastLanguageModel.for_inference(client) # Enable native 2x faster inference
             tokenizer = AutoTokenizer.from_pretrained(model)
-            client = AutoModelForCausalLM.from_pretrained(model)
             self.client = client
             self.tokenizer = tokenizer

 import gradio as gr
 #from unsloth import FastLanguageModel
+from peft import AutoPeftModelForCausalLM
+from transformers import TextIteratorStreamer, AutoTokenizer
 from threading import Thread
 """
             # )
             # FastLanguageModel.for_inference(client) # Enable native 2x faster inference
             tokenizer = AutoTokenizer.from_pretrained(model)
+            client = AutoPeftModelForCausalLM.from_pretrained(model, load_in_4bit=True)
             self.client = client
             self.tokenizer = tokenizer

requirements.txt CHANGED Viewed

@@ -1,3 +1,4 @@
 huggingface_hub==0.25.2
 transformers>=4.45.1
-torch

 huggingface_hub==0.25.2
 transformers>=4.45.1
+torch
+peft