webpluging

Paused

ranamhamoud commited on Dec 23, 2024

Commit

44a3700

verified ·

1 Parent(s): bb10c22

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -56,7 +56,7 @@ if not torch.cuda.is_available():
 if torch.cuda.is_available():
     # Model and Tokenizer Configuration
-    model_id = "meta-llama/Llama-3.1-8B-Instruct"
     bnb_config = BitsAndBytesConfig(
         load_in_4bit=True,
         bnb_4bit_use_double_quant=False,
@@ -64,7 +64,7 @@ if torch.cuda.is_available():
         bnb_4bit_compute_dtype=torch.bfloat16
     )
     base_model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto", quantization_config=bnb_config)
-    model = PeftModel.from_pretrained(base_model, "ranamhamoud/storytell")
     tokenizer = AutoTokenizer.from_pretrained(model_id)
     tokenizer.pad_token = tokenizer.eos_token

 if torch.cuda.is_available():
     # Model and Tokenizer Configuration
+    model_id = "meta-llama/Llama-3.1-8B"
     bnb_config = BitsAndBytesConfig(
         load_in_4bit=True,
         bnb_4bit_use_double_quant=False,
         bnb_4bit_compute_dtype=torch.bfloat16
     )
     base_model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto", quantization_config=bnb_config)
+    model = PeftModel.from_pretrained(base_model, "ranamhamoud/storytellai-2.0")
     tokenizer = AutoTokenizer.from_pretrained(model_id)
     tokenizer.pad_token = tokenizer.eos_token