Spaces:

IA2
/

IA2_model

Sleeping

App Files Files Community

AshenClock commited on Jan 3

Commit

ff8bfcc

verified ·

1 Parent(s): d68c6db

Update app.py

Browse files

Files changed (1) hide show

app.py +24 -37

app.py CHANGED Viewed

@@ -48,6 +48,7 @@ def create_data_directory():
     """Crea la directory 'data/' se non esiste."""
     os.makedirs(os.path.join(BASE_DIR, "data"), exist_ok=True)
     logger.info("Directory 'data/' creata o già esistente.")
 def extract_ontology(rdf_file: str, output_file: str):
     """
     Estrae classi, proprietà ed entità dall'ontologia RDF e le salva in un file JSON come un unico documento.
@@ -125,7 +126,6 @@ def extract_ontology(rdf_file: str, output_file: str):
         logger.error(f"Errore nel salvataggio di {output_file}: {e}")
         raise e
 def create_faiss_index(documents_file: str, index_file: str, embedding_model: str = 'all-MiniLM-L6-v2'):
     """
     Crea un indice FAISS a partire dal documento estratto.
@@ -284,7 +284,7 @@ def retrieve_relevant_documents(query: str, top_k: int = 5):
     except Exception as e:
         logger.error(f"Errore nel recupero dei documenti rilevanti: {e}")
         raise e
 def create_system_message(ont_text: str, retrieved_docs: str) -> str:
     """
     Prompt di sistema robusto, con regole su query in una riga e
@@ -323,23 +323,25 @@ Ho ottenuto questi risultati SPARQL:
 {results_str}
 Ora fornisci una breve spiegazione museale (massimo ~10 righe), senza inventare oltre i risultati.
 """
-async def call_hf_model(messages, temperature=0.5, max_tokens=1024) -> str:
     """Chiama il modello Hugging Face e gestisce la risposta."""
-    logger.debug("Chiamo HF con i seguenti messaggi:")
-    for m in messages:
-        content_preview = (m['content'][:300] + '...') if len(m['content']) > 300 else m['content']
-        logger.debug(f"ROLE={m['role']} => {content_preview}")
     try:
-        resp = client.chat.completions.create(
             model=HF_MODEL,
-            messages=messages,
-            temperature=temperature,
-            max_tokens=max_tokens,
-            top_p=0.9
         )
-        raw = resp["choices"][0]["message"]["content"]
-        # Forziamo la query su linea singola se multiline
         single_line = " ".join(raw.splitlines())
         logger.debug(f"Risposta HF single-line: {single_line}")
         return single_line.strip()
@@ -373,14 +375,11 @@ async def generate_response(req: QueryRequest):
         return {"type": "ERROR", "response": f"Errore nel recupero dei documenti: {e}"}
     sys_msg = create_system_message(knowledge_text, retrieved_docs)
-    msgs = [
-        {"role": "system", "content": sys_msg},
-        {"role": "user", "content": user_input}
-    ]
     # Primo tentativo
     try:
-        r1 = await call_hf_model(msgs, req.temperature, req.max_tokens)
         logger.info(f"PRIMA RISPOSTA:\n{r1}")
     except Exception as e:
         logger.error(f"Errore nella chiamata al modello Hugging Face: {e}")
@@ -389,13 +388,9 @@ async def generate_response(req: QueryRequest):
     # Se non parte con "PREFIX base:"
     if not r1.startswith("PREFIX base:"):
         sc = f"Non hai risposto con query SPARQL su una sola riga. Riprova. Domanda: {user_input}"
-        msgs2 = [
-            {"role": "system", "content": sys_msg},
-            {"role": "assistant", "content": r1},
-            {"role": "user", "content": sc}
-        ]
         try:
-            r2 = await call_hf_model(msgs2, req.temperature, req.max_tokens)
             logger.info(f"SECONDA RISPOSTA:\n{r2}")
             if r2.startswith("PREFIX base:"):
                 sparql_query = r2
@@ -421,13 +416,9 @@ async def generate_response(req: QueryRequest):
         logger.info(f"Query SPARQL eseguita con successo. Risultati: {len(results)}")
     except Exception as e:
         fallback = f"La query SPARQL ha fallito. Riprova. Domanda: {user_input}"
-        msgs3 = [
-            {"role": "system", "content": sys_msg},
-            {"role": "assistant", "content": sparql_query},
-            {"role": "user", "content": fallback}
-        ]
         try:
-            r3 = await call_hf_model(msgs3, req.temperature, req.max_tokens)
             logger.info(f"TERZA RISPOSTA (fallback):\n{r3}")
             if r3.startswith("PREFIX base:"):
                 sparql_query = r3
@@ -456,12 +447,8 @@ async def generate_response(req: QueryRequest):
     # Spiegazione
     exp_prompt = create_explanation_prompt(results_str)
-    msgs4 = [
-        {"role": "system", "content": exp_prompt},
-        {"role": "user", "content": ""}
-    ]
     try:
-        explanation = await call_hf_model(msgs4, req.temperature, req.max_tokens)
     except Exception as e:
         logger.error(f"Errore nella generazione della spiegazione: {e}")
         return {"type": "ERROR", "response": f"Errore nella generazione della spiegazione: {e}"}

     """Crea la directory 'data/' se non esiste."""
     os.makedirs(os.path.join(BASE_DIR, "data"), exist_ok=True)
     logger.info("Directory 'data/' creata o già esistente.")
 def extract_ontology(rdf_file: str, output_file: str):
     """
     Estrae classi, proprietà ed entità dall'ontologia RDF e le salva in un file JSON come un unico documento.
         logger.error(f"Errore nel salvataggio di {output_file}: {e}")
         raise e
 def create_faiss_index(documents_file: str, index_file: str, embedding_model: str = 'all-MiniLM-L6-v2'):
     """
     Crea un indice FAISS a partire dal documento estratto.
     except Exception as e:
         logger.error(f"Errore nel recupero dei documenti rilevanti: {e}")
         raise e
 def create_system_message(ont_text: str, retrieved_docs: str) -> str:
     """
     Prompt di sistema robusto, con regole su query in una riga e
 {results_str}
 Ora fornisci una breve spiegazione museale (massimo ~10 righe), senza inventare oltre i risultati.
 """
+async def call_hf_model(prompt: str, temperature=0.5, max_tokens=1024) -> str:
     """Chiama il modello Hugging Face e gestisce la risposta."""
+    logger.debug("Chiamo HF con il seguente prompt:")
+    content_preview = (prompt[:300] + '...') if len(prompt) > 300 else prompt
+    logger.debug(f"PROMPT => {content_preview}")
     try:
+        resp = client.text_generation(
             model=HF_MODEL,
+            inputs=prompt,
+            parameters={
+                "temperature": temperature,
+                "max_new_tokens": max_tokens,
+                "top_p": 0.9
+            }
         )
+        # La struttura della risposta dipende dall'API; verifica se "generated_text" è il campo corretto
+        raw = resp["generated_text"]
+        # Forza la risposta su una singola linea se multilinea
         single_line = " ".join(raw.splitlines())
         logger.debug(f"Risposta HF single-line: {single_line}")
         return single_line.strip()
         return {"type": "ERROR", "response": f"Errore nel recupero dei documenti: {e}"}
     sys_msg = create_system_message(knowledge_text, retrieved_docs)
+    prompt = f"{sys_msg}\nUtente: {user_input}\nAssistente:"
     # Primo tentativo
     try:
+        r1 = await call_hf_model(prompt, req.temperature, req.max_tokens)
         logger.info(f"PRIMA RISPOSTA:\n{r1}")
     except Exception as e:
         logger.error(f"Errore nella chiamata al modello Hugging Face: {e}")
     # Se non parte con "PREFIX base:"
     if not r1.startswith("PREFIX base:"):
         sc = f"Non hai risposto con query SPARQL su una sola riga. Riprova. Domanda: {user_input}"
+        fallback_prompt = f"{sys_msg}\nAssistente: {r1}\nUtente: {sc}\nAssistente:"
         try:
+            r2 = await call_hf_model(fallback_prompt, req.temperature, req.max_tokens)
             logger.info(f"SECONDA RISPOSTA:\n{r2}")
             if r2.startswith("PREFIX base:"):
                 sparql_query = r2
         logger.info(f"Query SPARQL eseguita con successo. Risultati: {len(results)}")
     except Exception as e:
         fallback = f"La query SPARQL ha fallito. Riprova. Domanda: {user_input}"
+        fallback_prompt = f"{sys_msg}\nAssistente: {sparql_query}\nUtente: {fallback}\nAssistente:"
         try:
+            r3 = await call_hf_model(fallback_prompt, req.temperature, req.max_tokens)
             logger.info(f"TERZA RISPOSTA (fallback):\n{r3}")
             if r3.startswith("PREFIX base:"):
                 sparql_query = r3
     # Spiegazione
     exp_prompt = create_explanation_prompt(results_str)
     try:
+        explanation = await call_hf_model(exp_prompt, req.temperature, req.max_tokens)
     except Exception as e:
         logger.error(f"Errore nella generazione della spiegazione: {e}")
         return {"type": "ERROR", "response": f"Errore nella generazione della spiegazione: {e}"}