Spaces:

filipealmeida
/

open-llama-3b-v2-pii-transform

filipealmeida commited on Sep 8, 2023

Commit

9c6b8fd

•

1 Parent(s): 18d0ebf

Command line argument for context size

Files changed (1) hide show

app.py CHANGED Viewed

@@ -47,6 +47,7 @@ def generate_text(prompt, example):
 parser = argparse.ArgumentParser()
 parser.add_argument("--model", help="Path to the model file")
 parser.add_argument("--gpu", help="How many GPU layers to use", default=0, type=int)
 args = parser.parse_args()
 if args.model:
@@ -55,7 +56,7 @@ else:
     model_path = download_model()
 # TODO n_gpu_layers doesn't seem to be working
-llm = Llama(model_path=model_path, n_gpu_layers=args.gpu)
 # Create a Gradio interface
 interface = gr.Interface(

 parser = argparse.ArgumentParser()
 parser.add_argument("--model", help="Path to the model file")
 parser.add_argument("--gpu", help="How many GPU layers to use", default=0, type=int)
+parser.add_argument("--ctx", help="How many context tokens to use", default=512, type=int)
 args = parser.parse_args()
 if args.model:
     model_path = download_model()
 # TODO n_gpu_layers doesn't seem to be working
+llm = Llama(model_path=model_path, n_gpu_layers=args.gpu, n_ctx=args.ctx)
 # Create a Gradio interface
 interface = gr.Interface(