Spaces:

Trabis
/

Lois_RAG

Running

App Files Files Community

Trabis commited on 9 days ago

Commit

fe6115e

verified ·

1 Parent(s): 1ac7dd4

Update app.py

Browse files

Files changed (1) hide show

app.py +116 -39

app.py CHANGED Viewed

@@ -443,77 +443,154 @@
-from fastapi import FastAPI, Request
 from fastapi.responses import StreamingResponse, HTMLResponse
 from fastapi.staticfiles import StaticFiles
 import uvicorn
-import asyncio # Pour le streaming
-# ... (imports OptimizedRAGLoader, LLM, etc.)
-# --- Initialisation (comme avant) ---
-# rag_loader = OptimizedRAGLoader()
-# llm = ChatGoogleGenerativeAI(...) # ou autre
-# retriever = rag_loader.get_retriever(...)
-# prompt_template = ChatPromptTemplate.from_messages(...)
 app = FastAPI()
-# --- Fonction backend modifiée (pour API) ---
-# Doit être adaptable pour streaming ou réponse unique
-def get_llm_response_stream(question: str):
-    # Réutilise la logique de process_question mais génère des chunks de texte
-    # Peut nécessiter des ajustements pour le format de streaming API (e.g., Server-Sent Events)
     print(f"API processing question: {question}")
     try:
         relevant_docs = retriever(question)
-        # ... (logique pour créer context, sources) ...
-        context_str = "..."
-        sources_str = "..."
         if not relevant_docs:
-             yield "data: لم أتمكن من العثور على معلومات ذات صلة.\n\n" # Format SSE
              return
         prompt = prompt_template.format_messages(context=context_str, question=question)
         full_response = ""
         stream = llm.stream(prompt)
         for chunk in stream:
              content = chunk.content if hasattr(chunk, 'content') else str(chunk)
              if content:
-                # Format pour Server-Sent Events (SSE)
-                # Chaque message doit être préfixé par "data: " et finir par "\n\n"
-                formatted_chunk = content.replace('\n', '\ndata: ') # Gère les sauts de ligne dans le chunk
-                yield f"data: {formatted_chunk}\n\n"
-                full_response += content # Accumule pour référence interne si besoin
-        # Envoyer les sources à la fin (aussi en format SSE)
-        yield f"data: {sources_str}\n\n"
     except Exception as e:
         print(f"Error during API LLM generation: {e}")
-        yield f"data: Erreur: {str(e)}\n\n"
 # --- Endpoint API ---
 @app.post("/ask")
 async def handle_ask(request: Request):
-    data = await request.json()
-    question = data.get("question")
-    if not question:
-        return {"error": "Question manquante"}, 400
-    # Pour une réponse non-streamée (plus simple au début)
-    # response_content = "".join(list(get_llm_response_stream(question))) # Collecter tout le stream
-    # return {"answer": response_content}
-    # Pour une réponse streamée (Server-Sent Events)
-    return StreamingResponse(get_llm_response_stream(question), media_type="text/event-stream")
 # --- Servir les fichiers statiques (HTML/JS/CSS) ---
 app.mount("/", StaticFiles(directory="static", html=True), name="static")
-# --- Démarrage du serveur (pour exécution locale/Spaces) ---
-# La commande de démarrage dans Spaces sera typiquement `uvicorn app:app --host 0.0.0.0 --port 7860`
 if __name__ == "__main__":
      uvicorn.run(app, host="0.0.0.0", port=7860)

+from fastapi import FastAPI, Request, HTTPException
 from fastapi.responses import StreamingResponse, HTMLResponse
 from fastapi.staticfiles import StaticFiles
 import uvicorn
+import asyncio
+import os # Assurez-vous que 'os' est importé si vous l'utilisez pour les clés API, etc.
+# --- Vos imports (Document, LLM, PromptTemplate, etc.) ---
+# from langchain_google_genai import ChatGoogleGenerativeAI
+# from langchain.prompts import ChatPromptTemplate
+# ... autres imports nécessaires ...
+# from your_rag_module import OptimizedRAGLoader # Assurez-vous que la classe est importable
+# --- Variables globales (initialisées à None) ---
+rag_loader = None
+llm = None
+retriever = None
+prompt_template = None
+initialization_error = None # Pour stocker une erreur d'initialisation
+# --- Bloc d'initialisation robuste ---
+print("--- Starting Application Initialization ---")
+try:
+    # Initialisation du LLM
+    print("Initializing LLM...")
+    gemini_api_key = os.getenv("GEMINI_KEY")
+    if not gemini_api_key:
+        raise ValueError("GEMINI_KEY environment variable not set.")
+    llm = ChatGoogleGenerativeAI(
+            model="gemini-1.5-flash",
+            temperature=0.1,
+            google_api_key=gemini_api_key,
+    )
+    print("LLM Initialized.")
+    # Initialisation RAG Loader et Retriever
+    print("Initializing RAG Loader...")
+    # Assurez-vous que OptimizedRAGLoader est défini ou importé correctement
+    rag_loader = OptimizedRAGLoader() # Cette ligne peut échouer (chargement modèles/index)
+    print("RAG Loader Initialized. Getting Retriever...")
+    retriever = rag_loader.get_retriever(k=15, rerank_k=5) # Cette ligne dépend de rag_loader
+    print("Retriever Initialized.")
+    # Initialisation du Prompt Template
+    print("Initializing Prompt Template...")
+    prompt_template = ChatPromptTemplate.from_messages([
+         ("system", """أنت مساعد قانوني خبير... (votre prompt système complet ici) ...السؤال المطلوب الإجابة عليه: {question}"""),
+         ("human", "{question}")
+    ])
+    print("Prompt Template Initialized.")
+    print("--- Application Initialization Successful ---")
+except Exception as e:
+    print(f"!!!!!!!!!! FATAL INITIALIZATION ERROR !!!!!!!!!!")
+    print(f"Error during startup: {e}")
+    import traceback
+    traceback.print_exc() # Affiche la trace complète de l'erreur dans les logs
+    initialization_error = str(e) # Stocke l'erreur pour l'API
+    # On laisse les variables globales à None si l'initialisation échoue
+# --- FastAPI App ---
 app = FastAPI()
+# --- Fonction backend modifiée ---
+# (get_llm_response_stream - Gardez la version précédente qui gère le streaming SSE)
+# Assurez-vous qu'elle utilise les variables globales llm, retriever, prompt_template
+async def get_llm_response_stream(question: str):
+    # *** Vérification cruciale au début de la fonction ***
+    if initialization_error:
+        yield f"data: Erreur critique lors de l'initialisation du serveur: {initialization_error}\n\n"
+        return
+    if not retriever or not llm or not prompt_template:
+        yield f"data: Erreur: Un ou plusieurs composants serveur (LLM, Retriever, Prompt) ne sont pas initialisés.\n\n"
+        return
+    # *** Fin de la vérification ***
     print(f"API processing question: {question}")
     try:
+        # Utilisation de la variable globale 'retriever'
         relevant_docs = retriever(question)
+        # ... (le reste de votre logique pour context, sources, llm.stream) ...
+        context_str = "\n\n".join([f"المصدر: {doc.metadata.get('source', 'غير معروف')}\nالمحتوى: {doc.page_content}" for doc in relevant_docs]) if relevant_docs else "لا يوجد سياق"
+        sources = sorted(list(set([os.path.splitext(doc.metadata.get("source", "غير معروف"))[0] for doc in relevant_docs]))) if relevant_docs else []
+        sources_str = "\n\n\nالمصادر المحتملة التي تم الرجوع إليها:\n- " + "\n- ".join(sources) if sources else ""
         if not relevant_docs:
+             # Gérer le cas où il n'y a pas de documents
+             yield f"data: لم أتمكن من العثور على معلومات ذات صلة في المستندات.\n\n"
+             # Optionnel: appeler le LLM sans contexte ou s'arrêter ici
              return
+        # Utilisation de la variable globale 'prompt_template'
         prompt = prompt_template.format_messages(context=context_str, question=question)
         full_response = ""
+        # Utilisation de la variable globale 'llm'
         stream = llm.stream(prompt)
         for chunk in stream:
              content = chunk.content if hasattr(chunk, 'content') else str(chunk)
              if content:
+                formatted_chunk = content.replace('\n', '\ndata: ')
+                yield f"data: {formatted_chunk}\n\n" # Format SSE
+                full_response += content
+        # Envoyer les sources à la fin
+        if sources_str:
+            # Assurez-vous que sources_str est bien formaté pour SSE s'il contient des sauts de ligne
+             sources_sse = sources_str.replace('\n', '\ndata: ')
+             yield f"data: {sources_sse}\n\n"
+        # Signal de fin (optionnel mais utile pour le client JS)
+        yield "event: end\ndata: Stream finished\n\n"
     except Exception as e:
         print(f"Error during API LLM generation: {e}")
+        import traceback
+        traceback.print_exc() # Affiche l'erreur dans les logs serveur
+        yield f"data: حدث خطأ أثناء معالجة طلبك: {str(e)}\n\n"
+        yield "event: error\ndata: Stream error\n\n" # Signale une erreur au client
 # --- Endpoint API ---
 @app.post("/ask")
 async def handle_ask(request: Request):
+    # Vérifie si l'initialisation globale a échoué dès le début
+    if initialization_error:
+         raise HTTPException(status_code=500, detail=f"Erreur d'initialisation serveur: {initialization_error}")
+    try:
+        data = await request.json()
+        question = data.get("question")
+        if not question:
+             raise HTTPException(status_code=400, detail="Question manquante dans la requête JSON")
+        # Retourne la réponse streamée
+        return StreamingResponse(get_llm_response_stream(question), media_type="text/event-stream")
+    except Exception as e:
+         print(f"Error in /ask endpoint: {e}")
+         raise HTTPException(status_code=500, detail=f"Erreur interne du serveur: {str(e)}")
 # --- Servir les fichiers statiques (HTML/JS/CSS) ---
+# Assurez-vous que le dossier 'static' existe et contient index.html, script.js, style.css
 app.mount("/", StaticFiles(directory="static", html=True), name="static")
+# --- Démarrage du serveur ---
 if __name__ == "__main__":
      uvicorn.run(app, host="0.0.0.0", port=7860)