Ryan66
/

llama2-gradio

Model card Files Files and versions Community

Ryan66 commited on Nov 17, 2023

Commit

2404bda

1 Parent(s): df2911c

update

1. gradio_demo.py 262行：model.generate(**kwargs) → model.generate(**kwargs, pad_token_id=tokenizer.eos_token_id)
2. gradio_demo.py 88行：tokenizer = LlamaTokenizer.from_pretrained(args.tokenizer_path) → tokenizer = LlamaTokenizer.from_pretrained(args.tokenizer_path,legacy=False)

Files changed (1) hide show

gradio_demo.py +2 -2

gradio_demo.py CHANGED Viewed

@@ -85,7 +85,7 @@ def setup():
         args.tokenizer_path = args.lora_model
         if args.lora_model is None:
             args.tokenizer_path = args.base_model
-    tokenizer = LlamaTokenizer.from_pretrained(args.tokenizer_path)
     base_model = LlamaForCausalLM.from_pretrained(
         args.base_model,
@@ -259,7 +259,7 @@ def predict(
             kwargs['stopping_criteria'] = [Stream(callback_func=callback)]
         clear_torch_cache()
         with torch.no_grad():
-            model.generate(**kwargs)
     def generate_with_streaming(**kwargs):
         return Iteratorize(generate_with_callback, kwargs, callback=None)

         args.tokenizer_path = args.lora_model
         if args.lora_model is None:
             args.tokenizer_path = args.base_model
+    tokenizer = LlamaTokenizer.from_pretrained(args.tokenizer_path,legacy=False)
     base_model = LlamaForCausalLM.from_pretrained(
         args.base_model,
             kwargs['stopping_criteria'] = [Stream(callback_func=callback)]
         clear_torch_cache()
         with torch.no_grad():
+            model.generate(**kwargs, pad_token_id=tokenizer.eos_token_id)
     def generate_with_streaming(**kwargs):
         return Iteratorize(generate_with_callback, kwargs, callback=None)