Spaces:

ArunAIML
/

FunAndExperimentGPT

Sleeping

ArunAIML commited on Mar 17, 2024

Commit

3b29101

1 Parent(s): 5ffcda6

advanced the gpt model to faster inference

Files changed (2) hide show

app.py CHANGED Viewed

@@ -1,9 +1,13 @@
-from transformers import pipeline
 import gradio as gr
 model_id = "gpt2-large"
-pipe = pipeline("text-generation", model=model_id)
 def gpt(prompt, top_k, penalty_alpha):
     return pipe(prompt, top_k=top_k, penalty_alpha=penalty_alpha)[0]["generated_text"]

+from transformers import pipeline, AutoTokenizer
 import gradio as gr
 model_id = "gpt2-large"
+tokenizer = AutoTokenizer.from_pretrained(model_id)
+model = AutoModelForCausalLM.from_pretrained(model_id)
+model.to_bettertransformer()
+pipe = pipeline("text-generation", model=model, tokenizer= tokenizer)
 def gpt(prompt, top_k, penalty_alpha):
     return pipe(prompt, top_k=top_k, penalty_alpha=penalty_alpha)[0]["generated_text"]

requirements.txt CHANGED Viewed

@@ -1,3 +1,4 @@
 transformers
 gradio
 torch

 transformers
 gradio
 torch
+optimum