Spaces:

ayyuce
/

SmolGRPO-135M

Sleeping

App Files Files Community

ayyuce commited on 26 days ago

Commit

37ada06

verified ·

1 Parent(s): ed6eec3

Update app.py

Browse files

Files changed (1) hide show

app.py +37 -27

app.py CHANGED Viewed

@@ -2,39 +2,49 @@ import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
-model_name = "ayyuce/SmolGRPO-135M"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name)
-model.to("cpu")
-def generate_text(prompt):
-    inputs = tokenizer(prompt, return_tensors="pt")
-    inputs = {key: value.to("cpu") for key, value in inputs.items()}
-    prompt_length = inputs["input_ids"].shape[1]
-    outputs = model.generate(
-        **inputs,
-        max_length=prompt_length + 50,
-        min_length=prompt_length + 1,
-        do_sample=True,
-        top_p=0.95,
-        top_k=50
-    )
-    generated_text = tokenizer.decode(outputs[0][prompt_length:], skip_special_tokens=True)
-    return generated_text
-demo = gr.Interface(
-    fn=generate_text,
-    inputs="text",
-    outputs="text",
-    title="SmolGRPO-135M Generator",
-    description="Generate text with the SmolGRPO-135M."
-)
 if __name__ == "__main__":
     demo.launch()

 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
+# Load the tokenizer and model
+model_name = "ayyuce/SmolGRPO-135M"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name)
+# Initialize the text-generation pipeline
+generator = pipeline("text-generation", model=model, tokenizer=tokenizer, device=-1)  # device=-1 ensures CPU usage
+def generate_text(prompt, max_new_tokens, temperature, top_p, do_sample):
+    # Define generation parameters
+    generate_kwargs = {
+        "max_new_tokens": int(max_new_tokens),
+        "temperature": float(temperature),
+        "top_p": float(top_p),
+        "do_sample": do_sample == "Yes",
+    }
+    # Generate text
+    generated_list = generator(prompt, **generate_kwargs)
+    # Extract the generated text from the first item in the list
+    generated_text = generated_list[0]["generated_text"]
+    return generated_text
+# Create the Gradio interface
+with gr.Blocks() as demo:
+    gr.Markdown("# SmolGRPO-135M Text Generator")
+    with gr.Row():
+        with gr.Column():
+            prompt = gr.Textbox(label="Prompt", lines=5, placeholder="Enter your prompt here...")
+            max_new_tokens = gr.Number(label="Max New Tokens", value=256)
+            temperature = gr.Slider(label="Temperature", minimum=0.0, maximum=1.0, value=0.5)
+            top_p = gr.Slider(label="Top-p (Nucleus Sampling)", minimum=0.0, maximum=1.0, value=0.9)
+            do_sample = gr.Dropdown(label="Do Sample", choices=["Yes", "No"], value="Yes")
+            generate_button = gr.Button("Generate Text")
+        with gr.Column():
+            output = gr.Textbox(label="Generated Text", lines=15)
+    generate_button.click(
+        fn=generate_text,
+        inputs=[prompt, max_new_tokens, temperature, top_p, do_sample],
+        outputs=output
+    )
 if __name__ == "__main__":
     demo.launch()