Spaces:

BeveledCube
/

bevelapi

Running

App Files Files Community

BeveledCube commited on Jan 26, 2024

Commit

9920987

verified ·

1 Parent(s): 781452b

Update main.py

Browse files

Files changed (1) hide show

main.py +13 -50

main.py CHANGED Viewed

@@ -9,9 +9,8 @@ from transformers import GPT2LMHeadModel, GPT2Tokenizer, AutoModelForCausalLM, A
 import torch
 app = FastAPI()
-name = "TinyLlama/TinyLlama-1.1B-Chat-v1.0"
 customGen = False
-gpt2based = False
 # microsoft/DialoGPT-small
 # microsoft/DialoGPT-medium
@@ -38,53 +37,17 @@ def read_root():
 def read_root(data: req):
   print("Prompt:", data.prompt)
   print("Length:", data.length)
-  if (name == "microsoft/DialoGPT-small" or name == "microsoft/DialoGPT-medium" or name == "microsoft/DialoGPT-large") and customGen == True:
-    # tokenizer = AutoTokenizer.from_pretrained("microsoft/DialoGPT-small")
-    # model = AutoModelForCausalLM.from_pretrained("microsoft/DialoGPT-small")
-    step = 1
-    # encode the new user input, add the eos_token and return a tensor in Pytorch
-    new_user_input_ids = tokenizer.encode(data.prompt + tokenizer.eos_token, return_tensors='pt')
-    # append the new user input tokens to the chat history
-    bot_input_ids = torch.cat(new_user_input_ids, dim=-1) if step > 0 else new_user_input_ids
-    # generated a response while limiting the total chat history to 1000 tokens,
-    chat_history_ids = model.generate(bot_input_ids, max_length=1000, pad_token_id=tokenizer.eos_token_id)
-    generated_text = tokenizer.decode(chat_history_ids[:, :][0], skip_special_tokens=True)
-    answer_data = { "answer": generated_text }
-    print("Answer:", generated_text)
-    return answer_data
-  else:
-    if gpt2based == True:
-      input_text = data.prompt
-      # Tokenize the input text
-      input_ids = gpt2tokenizer.encode(input_text, return_tensors="pt")
-      # Generate output using the model
-      output_ids = gpt2model.generate(input_ids, max_length=data.length, num_beams=5, no_repeat_ngram_size=2)
-      generated_text = gpt2tokenizer.decode(output_ids[0], skip_special_tokens=True)
-      answer_data = { "answer": generated_text }
-      print("Answer:", generated_text)
-      return answer_data
-    else:
-      input_text = data.prompt
-      # Tokenize the input text
-      input_ids = tokenizer.encode(input_text, return_tensors="pt")
-      # Generate output using the model
-      output_ids = model.generate(input_ids, max_length=data.length, num_beams=5, no_repeat_ngram_size=2)
-      generated_text = tokenizer.decode(output_ids[0], skip_special_tokens=True)
-      answer_data = { "answer": generated_text }
-      print("Answer:", generated_text)
-      return answer_data

 import torch
 app = FastAPI()
+name = "microsoft/DialoGPT-medium"
 customGen = False
 # microsoft/DialoGPT-small
 # microsoft/DialoGPT-medium
 def read_root(data: req):
   print("Prompt:", data.prompt)
   print("Length:", data.length)
+  input_text = data.prompt
+  # Tokenize the input text
+  input_ids = tokenizer.encode(input_text, return_tensors="pt")
+  # Generate output using the model
+  output_ids = model.generate(input_ids, max_length=data.length, num_beams=5, no_repeat_ngram_size=2)
+  generated_text = tokenizer.decode(output_ids[0], skip_special_tokens=True)
+  answer_data = { "answer": generated_text }
+  print("Answer:", generated_text)
+  return answer_data