RAGchat

Build error

moriire commited on Apr 23, 2024

Commit

682ac66

verified ·

1 Parent(s): 0d38122

Update app/llm.py

Files changed (1) hide show

app/llm.py CHANGED Viewed

@@ -36,7 +36,7 @@ llm_chat = llama_cpp.Llama.from_pretrained(
     verbose=False,
      n_ctx=1024,
      n_gpu_layers=0,
-    #chat_format="llama-2"
 )
 llm_generate = llama_cpp.Llama.from_pretrained(
     repo_id="moriire/healthcare-GGUF",
@@ -47,7 +47,7 @@ llm_generate = llama_cpp.Llama.from_pretrained(
      n_gpu_layers=0,
     mirostat_mode=2,
     mirostat_tau=4.0,
-    mirostat_eta=1.1
     #chat_format="llama-2"
 )
 # Logger setup
@@ -87,7 +87,7 @@ async def chat(chatm:ChatModel):#, user: schemas.BaseUser = fastapi.Depends(curr
         print(output)
         #print(output)
         et = time()
-        output["time"] = et - st
         #messages.append({'role': "assistant", "content": output['choices'][0]['message']['content']})
         #print(messages)
         return output

     verbose=False,
      n_ctx=1024,
      n_gpu_layers=0,
+    chat_format="llama-2"
 )
 llm_generate = llama_cpp.Llama.from_pretrained(
     repo_id="moriire/healthcare-GGUF",
      n_gpu_layers=0,
     mirostat_mode=2,
     mirostat_tau=4.0,
+    mirostat_eta=1.1,
     #chat_format="llama-2"
 )
 # Logger setup
         print(output)
         #print(output)
         et = time()
+        #output["time"] = et - st
         #messages.append({'role': "assistant", "content": output['choices'][0]['message']['content']})
         #print(messages)
         return output