Spaces:

chaseharmon
/

Rap-Verse-Generation-Demo

Sleeping

chaseharmon commited on Apr 2, 2024

Commit

62ed4f6

1 Parent(s): 50e2273

quant

Files changed (1) hide show

app.py CHANGED Viewed

@@ -17,6 +17,7 @@ def load_model():
     model = AutoModelForCausalLM.from_pretrained(
         base_model_name,
         device_map='auto',
     )
     model.config.use_cache = False
     model.config.pretraining_tp = 1
@@ -49,6 +50,7 @@ display = "Ask Rap-Mistral Something"
 st.write(display)
 question = st.chat_input("Write a verse in the style of Lupe Fiasco")
 if question:
     prompt = build_prompt(question)
     inputs = tokenizer(prompt, return_tensors="pt")
     model_inputs = inputs.to('cuda')

     model = AutoModelForCausalLM.from_pretrained(
         base_model_name,
         device_map='auto',
+        quantization_config=nf4_config,
     )
     model.config.use_cache = False
     model.config.pretraining_tp = 1
 st.write(display)
 question = st.chat_input("Write a verse in the style of Lupe Fiasco")
 if question:
+    display = "Loading..."
     prompt = build_prompt(question)
     inputs = tokenizer(prompt, return_tensors="pt")
     model_inputs = inputs.to('cuda')