TheBloke
/

Upstage-Llama-2-70B-instruct-v2-GGML

Text Generation

Model card Files Files and versions Community

TheBloke commited on Jul 31, 2023

Commit

a8091d7

•

1 Parent(s): 6d15ad7

Initial GGML model commit

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -207,7 +207,7 @@ inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
 del inputs['token_type_ids']
 streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)
 output = model.generate(**inputs, streamer=streamer, use_cache=True, max_new_tokens=float('inf'))
-output_text = tokenizer.decode(output[0], skip_prompt=True, skip_special_tokens=True)
 ```
 **Our model can handle >10k input tokens thanks to the `rope_scaling` option.**

 del inputs['token_type_ids']
 streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)
 output = model.generate(**inputs, streamer=streamer, use_cache=True, max_new_tokens=float('inf'))
+output_text = tokenizer.decode(output[0], skip_special_tokens=True)
 ```
 **Our model can handle >10k input tokens thanks to the `rope_scaling` option.**