Spaces:

ChihChiu29
/

mychatbot

Runtime error

ChihChiu29 commited on Jan 3, 2023

Commit

1839808

1 Parent(s): b6eb5c9

make temperature and max_length parameters

Files changed (1) hide show

main.py CHANGED Viewed

@@ -35,18 +35,19 @@ token_size_limit = 512
 app = FastAPI()
 @app.post('/reply')
 async def Reply(req: Request):
     request = await req.json()
-    msg = request['msg']
     print(f'MSG: {msg}')
     input_ids = tokenizer(msg, return_tensors='pt').input_ids  # .to('cuda')
     output = model.generate(
         input_ids[:, -token_size_limit:],
         do_sample=True,
-        temperature=0.9,
-        max_length=100,
     )
     reply = tokenizer.batch_decode(output)[0]
     print(f'REPLY: {reply}')

 app = FastAPI()
+# { msg: string, temperature: float, max_length: number }
 @app.post('/reply')
 async def Reply(req: Request):
     request = await req.json()
+    msg = request.get('msg')
     print(f'MSG: {msg}')
     input_ids = tokenizer(msg, return_tensors='pt').input_ids  # .to('cuda')
     output = model.generate(
         input_ids[:, -token_size_limit:],
         do_sample=True,
+        temperature=request.get('temperature', 0.9),
+        max_length=request.get('max_length', 100),
     )
     reply = tokenizer.batch_decode(output)[0]
     print(f'REPLY: {reply}')