Spaces:

UniverseTBD
/

astrollama

Runtime error

joshnguyen commited on Sep 14, 2023

Commit

74a3063

1 Parent(s): 6797eb5

Change max_new_tokens to max_length

Files changed (1) hide show

app.py CHANGED Viewed

@@ -30,7 +30,7 @@ model = AutoModelForCausalLM.from_pretrained(
 def generate_text(prompt: str,
-                  max_new_tokens: int = 512,
                   temperature: float = 0.5,
                   top_p: float = 0.95,
                   top_k: int = 50) -> str:
@@ -43,8 +43,6 @@ def generate_text(prompt: str,
     inputs = inputs.to(DEVICE)
     # Prepare arguments for generation
-    input_length = inputs["input_ids"].shape[-1]
-    max_new_tokens = min(max_new_tokens, WINDOW_SIZE - input_length)
     if temperature >= 1.0:
         temperature = 0.99
     elif temperature <= 0.0:
@@ -60,7 +58,7 @@ def generate_text(prompt: str,
     generation_kwargs = dict(
         inputs=inputs,
         streamer=inputs,
-        max_new_tokens=max_new_tokens,
         do_sample=True,
         top_p=top_p,
         top_k=top_k,
@@ -90,7 +88,7 @@ demo = gr.Interface(
             scale=10,
         ),
         gr.Slider(
-            label="Maximum new tokens",
             minimum=1,
             maximum=4096,
             step=1,

 def generate_text(prompt: str,
+                  max_length: int = 1024,
                   temperature: float = 0.5,
                   top_p: float = 0.95,
                   top_k: int = 50) -> str:
     inputs = inputs.to(DEVICE)
     # Prepare arguments for generation
     if temperature >= 1.0:
         temperature = 0.99
     elif temperature <= 0.0:
     generation_kwargs = dict(
         inputs=inputs,
         streamer=inputs,
+        max_length=max_length,
         do_sample=True,
         top_p=top_p,
         top_k=top_k,
             scale=10,
         ),
         gr.Slider(
+            label="Maximum length of the output",
             minimum=1,
             maximum=4096,
             step=1,