Spaces:

Gyr0MAN
/

Ragbot

Runtime error

Gyr0MAN commited on May 27, 2024

Commit

8a92e12

verified ·

1 Parent(s): 2d1803e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,7 +7,7 @@ tokenizer = AutoTokenizer.from_pretrained("ping98k/typhoon-7b-rag-instruct-th")
 model = AutoModelForCausalLM.from_pretrained("ping98k/typhoon-7b-rag-instruct-th", device_map={"": 0})
 @spaces.GPU(duration=120)
-def response(instruction, history, inputText):
     inp = f"""### Instruction:
 {instruction}
@@ -18,7 +18,7 @@ def response(instruction, history, inputText):
 ### Response:"""
     print(f"Ask: {instruction}")
     input_ids = tokenizer(inp, return_tensors='pt').to("cuda")
     beam_output = model.generate(**input_ids, max_new_tokens=300)
     outputText = tokenizer.decode(beam_output[0], skip_special_token=True)
@@ -38,4 +38,19 @@ gr.ChatInterface(
     additional_inputs=[
         gr.Textbox(defaultInput, label="Input Text"),
     ],
-).launch()

 model = AutoModelForCausalLM.from_pretrained("ping98k/typhoon-7b-rag-instruct-th", device_map={"": 0})
 @spaces.GPU(duration=120)
+'''def response(instruction, history, inputText):
     inp = f"""### Instruction:
 {instruction}
 ### Response:"""
     print(f"Ask: {instruction}")
     input_ids = tokenizer(inp, return_tensors='pt').to("cuda")
     beam_output = model.generate(**input_ids, max_new_tokens=300)
     outputText = tokenizer.decode(beam_output[0], skip_special_token=True)
     additional_inputs=[
         gr.Textbox(defaultInput, label="Input Text"),
     ],
+).launch()'''
+def response(inp):
+    input_ids = tokenizer(inp, return_tensors='pt').to("cuda")
+    beam_output = model.generate(**input_ids, max_new_tokens=300)
+    outputText = tokenizer.decode(beam_output[0], skip_special_token=True)
+    outputText = outputText.replace(inp,"").replace("<s>","").replace("</s>","")
+    print(f"Ans: {outputText}")
+    return outputText
+gradio_interface = gradio.Interface(
+  fn=response
+)
+gradio_interface.launch()