Spaces:

MoslemBot
/

kajibuku

Running

Bofandra commited on Jun 29

Commit

e6d25ac

verified ·

1 Parent(s): b1aa160

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -23,7 +23,7 @@ def upload_to_hub(local_path, remote_path):
 # Initialize embedder and LLM client
 embedder = SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")
-llm = InferenceClient("google/gemma-7b-it", token=os.getenv("HF_TOKEN"))
 DATA_DIR = "data"
 os.makedirs(DATA_DIR, exist_ok=True)
@@ -83,10 +83,21 @@ def ask_question(message, history, selected_titles):
             D, I = index.search(q_embed, k=3)
             context = "\n".join([chunks[i] for i in I[0]])
-            prompt = f"Context:\n{context}\n\nQuestion: {message}\nAnswer:"
-            print(prompt)
-            response = llm.text_generation(prompt, max_new_tokens=200)
-            print(response)
             combined_answer += f"**{title}**:\n{response.strip()}\n\n"
         except Exception as e:
             combined_answer += f"⚠️ Error with {title}: {str(e)}\n\n"

 # Initialize embedder and LLM client
 embedder = SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")
+llm = InferenceClient(token=os.getenv("HF_TOKEN"))
 DATA_DIR = "data"
 os.makedirs(DATA_DIR, exist_ok=True)
             D, I = index.search(q_embed, k=3)
             context = "\n".join([chunks[i] for i in I[0]])
+            #prompt = f"Context:\n{context}\n\nQuestion: {message}\nAnswer:"
+            #print(prompt)
+            response = llm.chat_completion(
+                messages=[
+                    {"role": "system", "content": "You are a helpful assistant. Answer based only on the given context."},
+                    {"role": "user", "content": f"Context:\n{context}\n\nQuestion: {message}"}
+                ],
+                model="deepseek-ai/DeepSeek-R1-0528",
+                max_tokens=200,
+            )
+            response = response.choices[0].message["content"]
+            #response = llm.text_generation(prompt, max_new_tokens=200)
+            #print(response)
             combined_answer += f"**{title}**:\n{response.strip()}\n\n"
         except Exception as e:
             combined_answer += f"⚠️ Error with {title}: {str(e)}\n\n"