Spaces:

abdfajar707
/

LLaMa3_RKPCase

Paused

abdfajar707 commited on Jul 2, 2024

Commit

b514c5e

verified ·

1 Parent(s): 6a5528b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -17,7 +17,7 @@ alpaca_prompt = """Berikut adalah instruksi yang deskripsikan tugas dan sepasang
 if True:
     from app import FastLanguageModel
     model, tokenizer = FastLanguageModel.from_pretrained(
-        model_name = "abdfajar707/llama3_8B_lora_model_rkp_v5", # YOUR MODEL YOU USED FOR TRAINING
         max_seq_length = max_seq_length,
         dtype = dtype,
         load_in_4bit = load_in_4bit,
@@ -27,14 +27,10 @@ if True:
 # Fungsi untuk menghasilkan respons
-def generate_response(prompt, max_length=1000):
     inputs = tokenizer(
 [
-    alpaca_prompt.format(
-        prompt, # instruction
-        "", # input
-        "", # output - leave this blank for generation!
-    )
 ], return_tensors = "pt").to("cuda")
     outputs = model.generate(**inputs, max_length=max_length, pad_token_id=tokenizer.eos_token_id)
     response = tokenizer.decode(outputs[0], skip_special_tokens=True)

 if True:
     from app import FastLanguageModel
     model, tokenizer = FastLanguageModel.from_pretrained(
+        model_name = "abdfajar707/llama3_8B_lora_model_rkp_v1.1", # YOUR MODEL YOU USED FOR TRAINING
         max_seq_length = max_seq_length,
         dtype = dtype,
         load_in_4bit = load_in_4bit,
 # Fungsi untuk menghasilkan respons
+def generate_response(prompt, max_length=4096):
     inputs = tokenizer(
 [
+    prompt, # instruction
 ], return_tensors = "pt").to("cuda")
     outputs = model.generate(**inputs, max_length=max_length, pad_token_id=tokenizer.eos_token_id)
     response = tokenizer.decode(outputs[0], skip_special_tokens=True)