Spaces:

IA2
/

IA2_model

Sleeping

App Files Files Community

AshenClock commited on Dec 31, 2024

Commit

51695fc

verified ·

1 Parent(s): 848d0c0

Update app.py

Browse files

Files changed (1) hide show

app.py +179 -153

app.py CHANGED Viewed

@@ -4,19 +4,16 @@ from typing import Optional
 from pydantic import BaseModel
 from fastapi import FastAPI, HTTPException
 import rdflib
 from huggingface_hub import InferenceClient
 logging.basicConfig(
     level=logging.DEBUG,
     format="%(asctime)s - %(levelname)s - %(message)s",
-    handlers=[
-        logging.FileHandler("app.log"),
-        logging.StreamHandler()
-    ]
 )
 logger = logging.getLogger(__name__)
-# Imposta la tua HF_API_KEY
 API_KEY = os.getenv("HF_API_KEY")
 if not API_KEY:
     logger.error("HF_API_KEY non impostata.")
@@ -25,217 +22,246 @@ if not API_KEY:
 client = InferenceClient(api_key=API_KEY)
 RDF_FILE = "Ontologia.rdf"
-MAX_TRIPLES = 300    # Se la tua ontologia è enorme, abbassa questo
 HF_MODEL = "Qwen/Qwen2.5-72B-Instruct"
-# Carica e "preprocessa" l'ontologia
-def load_ontology_as_text(rdf_file: str, max_triples: int=300) -> str:
     """
-    Legge un numero limitato di triple dal file RDF e le concatena in
-    una stringa. Limita i literal in lunghezza per non gonfiare troppo il prompt.
     """
     if not os.path.exists(rdf_file):
-        logger.warning("File RDF non trovato.")
-        return "NO_RDF"
     g = rdflib.Graph()
     try:
         g.parse(rdf_file, format="xml")
     except Exception as e:
-        logger.error(f"Errore parsing RDF: {e}")
         return "PARSING_ERROR"
-    lines = []
-    count = 0
-    for s,p,o in g:
-        if count >= max_triples:
-            break
-        # Taglia i literal in modo da non superare un tot di caratteri
-        s_str = str(s)[:100].replace("\n"," ")
-        p_str = str(p)[:100].replace("\n"," ")
-        o_str = str(o)[:100].replace("\n"," ")
-        lines.append(f"{s_str}|{p_str}|{o_str}")
-        count+=1
-    # Concateniamo le triple su righe separate (più facile da leggere).
-    # Se preferisci su un'unica riga, puoi usare " ".join(lines).
-    ontology_text = "\n".join(lines)
-    logger.debug(f"Caricate {count} triple.")
-    return ontology_text
-knowledge_text = load_ontology_as_text(RDF_FILE, MAX_TRIPLES)
 def create_system_message(ont_text: str) -> str:
     """
-    Prompt di sistema robusto e stringente.
-    - Forza query SPARQL in UNA sola riga
-    - Richiede secondi tentativi
-    - Domande generiche -> risposte brevi, ma se c'è un modo di fare query, farlo
     """
-    system_msg = f"""
-Sei un assistente museale. Hai a disposizione un estratto di triple RDF (massimo {MAX_TRIPLES}):
---- TRIPLE ---
 {ont_text}
---- FINE TRIPLE ---
-REGOLE STRINGENTI:
-1) Se l'utente chiede informazioni correlate alle triple, DEVI generare una query SPARQL in UNA SOLA RIGA,
-   con il prefisso:
-     PREFIX base: <http://www.semanticweb.org/lucreziamosca/ontologies/progettoMuseo#>
-   Esempio: PREFIX base: <...> SELECT ?x WHERE {{ ... }} (tutto su una sola riga).
-2) Se la query produce 0 risultati o fallisce, devi ritentare con un secondo tentativo,
-   magari usando FILTER(STR(...)) o @it, o cambiando minuscole/maiuscole.
-3) Se la domanda è una chat generica, rispondi breve (saluto, ecc.). Ma se c'è qualcosa
-   di correlato, prova comunque la query.
-4) Se generi la query e trovi risultati, la risposta finale deve essere la query SPARQL
-   (una sola riga). Non inventare triple inesistenti.
-5) Se non trovi nulla, rispondi 'Non ci sono informazioni in queste triple.'
-6) Non ignorare: se l'utente fa domanda su 'David', 'Amore e Psiche', etc., devi
-   estrarre dai triple tutti i dettagli possibili con SPARQL.
-7) Se la query produce 0, prova un secondo tentativo con sintassi differente.
-8) Non fare risposte su più righe per la query: una sola riga.
-FINE REGOLE.
-    """
-    return system_msg
-def create_explanation_prompt(results_str: str) -> str:
-    """
-    Prompt per spiegazione finale, robusto:
-    - Spiega i risultati come guida museale
-    - Non inventare
-    - 10-15 righe max
-    """
-    msg = f"""
-Ho ottenuto questi risultati SPARQL:
 {results_str}
-Ora fornisci una spiegazione come guida museale, in modo comprensibile e dettagliato (max ~10-15 righe).
-Cita eventuali materiali, periodi storici, autore, facendo riferimento al contesto RDF (ma senza contraddizioni).
-Non inventare nulla oltre ciò che appare nei risultati.
-    """
-    return msg
-async def call_hf_model(messages, temperature=0.7, max_tokens=1024) -> str:
-    """
-    Funzione di chiamata al modello su HuggingFace,
-    con log e robustezza. max_tokens=1024 come richiesto.
-    """
-    logger.debug("Chiamo HF con i seguenti messaggi:")
     for m in messages:
-        logger.debug(f"ROLE={m['role']} -> {m['content'][:500]}")
     try:
-        resp = client.chat.completions.create(
             model=HF_MODEL,
             messages=messages,
             temperature=temperature,
             max_tokens=max_tokens,
             top_p=0.9
         )
-        raw = resp["choices"][0]["message"]["content"]
-        logger.debug(f"Risposta HF: {raw}")
         return raw.replace("\n"," ").strip()
     except Exception as e:
-        logger.error(f"Errore HF: {e}")
         raise HTTPException(status_code=500, detail=str(e))
-app = FastAPI()
 class QueryRequest(BaseModel):
-    message: str
-    max_tokens: int = 1024
-    temperature: float = 0.5
 @app.post("/generate-response/")
-async def generate_response(req: QueryRequest):
-    user_input = req.message
-    logger.info(f"Utente chiede: {user_input}")
-    system_msg = create_system_message(knowledge_text)
-    messages = [
-        {"role":"system","content":system_msg},
         {"role":"user","content":user_input}
     ]
-    # Prima risposta
-    first_response = await call_hf_model(messages, req.temperature, req.max_tokens)
-    logger.info(f"Prima risposta generata:\n{first_response}")
-    # Se non inizia con 'PREFIX base:' => second attempt
-    if not first_response.startswith("PREFIX base:"):
-        second_prompt = f"Non hai risposto con query SPARQL in una sola riga. Riprova. Domanda: {user_input}"
-        second_msgs = [
-            {"role":"system","content":system_msg},
-            {"role":"assistant","content":first_response},
-            {"role":"user","content":second_prompt}
         ]
-        second_response = await call_hf_model(second_msgs, req.temperature, req.max_tokens)
-        logger.info(f"Seconda risposta:\n{second_response}")
-        if second_response.startswith("PREFIX base:"):
-            sparql_query = second_response
         else:
-            return {"type":"NATURAL","response": second_response}
     else:
-        sparql_query = first_response
-    # Eseguiamo la query con rdflib
-    g = rdflib.Graph()
     try:
-        g.parse(RDF_FILE, format="xml")
     except Exception as e:
-        logger.error("Errore parse RDF: ", e)
-        return {"type":"ERROR","response":"Parsing RDF fallito."}
-    # Se la query è malformata, second attempt
     try:
-        results = g.query(sparql_query)
     except Exception as e:
-        logger.warning(f"La query SPARQL ha fallito: {e}")
-        fallback_prompt = f"La query SPARQL è fallita. Riprova con altra sintassi. Domanda: {user_input}"
-        fallback_msgs = [
-            {"role":"system","content":system_msg},
             {"role":"assistant","content":sparql_query},
-            {"role":"user","content":fallback_prompt}
         ]
-        fallback_resp = await call_hf_model(fallback_msgs, req.temperature, req.max_tokens)
-        if fallback_resp.startswith("PREFIX base:"):
-            sparql_query = fallback_resp
             try:
-                results = g.query(sparql_query)
             except Exception as e2:
-                return {"type":"ERROR","response":f"Query fallita di nuovo: {e2}"}
         else:
-            return {"type":"NATURAL","response": fallback_resp}
     if len(results)==0:
-        logger.info("0 risultati SPARQL.")
-        return {"type":"NATURAL","sparql_query": sparql_query,"response":"Nessun risultato."}
-    # Prepara i risultati per la spiegazione
-    row_list = []
     for row in results:
-        row_list.append(", ".join([f"{k}:{v}" for k,v in row.asdict().items()]))
-    results_str = "\n".join(row_list)
-    logger.info(f"Risultati trovati ({len(results)}):\n{results_str}")
-    # Prompt di interpretazione
-    explain_sys = create_explanation_prompt(results_str)
-    explain_msgs = [
-        {"role":"system","content":explain_sys},
         {"role":"user","content":""}
     ]
-    explanation = await call_hf_model(explain_msgs, req.temperature, req.max_tokens)
-    logger.info(f"Spiegazione:\n{explanation}")
-    # Ritorniamo query, risultati e spiegazione
     return {
         "type":"NATURAL",
-        "sparql_query": sparql_query,
-        "sparql_results": row_list,
-        "explanation": explanation
     }
 @app.get("/")
 def home():
-    return {"message":"OK robusto con regole rigide e doppio tentativo."}

 from pydantic import BaseModel
 from fastapi import FastAPI, HTTPException
 import rdflib
+from rdflib import RDF, RDFS, OWL
 from huggingface_hub import InferenceClient
 logging.basicConfig(
     level=logging.DEBUG,
     format="%(asctime)s - %(levelname)s - %(message)s",
+    handlers=[logging.FileHandler("app.log"), logging.StreamHandler()]
 )
 logger = logging.getLogger(__name__)
 API_KEY = os.getenv("HF_API_KEY")
 if not API_KEY:
     logger.error("HF_API_KEY non impostata.")
 client = InferenceClient(api_key=API_KEY)
 RDF_FILE = "Ontologia.rdf"
 HF_MODEL = "Qwen/Qwen2.5-72B-Instruct"
+# Limiti per non sforare la dimensione del prompt
+MAX_CLASSES         = 30
+MAX_PROPERTIES      = 30
+MAX_INDIVIDUALS     = 50
+MAX_TRIPLES_PER_IND = 20
+MAX_LITERAL_CHARS   = 100
+def extract_ontology_summaries(rdf_file: str) -> str:
     """
+    1) Carica l'ontologia con rdflib.
+    2) Estrae:
+       - un elenco (massimo MAX_CLASSES) di classi
+       - un elenco (massimo MAX_PROPERTIES) di proprietà
+       - un estratto di triple relative alle istanze (NamedIndividual)
+         (massimo MAX_INDIVIDUALS individui, e MAX_TRIPLES_PER_IND triple per individuo).
+    3) Ritorna una stringa 'knowledge_text' che unisce questi contenuti.
     """
     if not os.path.exists(rdf_file):
+        return "NO_RDF_FILE"
     g = rdflib.Graph()
     try:
         g.parse(rdf_file, format="xml")
     except Exception as e:
+        logger.error(f"Parsing RDF error: {e}")
         return "PARSING_ERROR"
+    # ====== Troviamo le Classi ======
+    # Con un pattern: (s, RDF.type, OWL.Class) o RDFS.Class
+    # Alcune ontologie usano direct typing, altre no.
+    classes_found = set()
+    for s in g.subjects(RDF.type, OWL.Class):
+        classes_found.add(s)
+    # Alcune volte ci sono (s, RDF.type, RDFS.Class)
+    for s in g.subjects(RDF.type, RDFS.Class):
+        classes_found.add(s)
+    classes_list = sorted(str(c) for c in classes_found)
+    classes_list = classes_list[:MAX_CLASSES]
+    # ====== Troviamo le Proprietà ======
+    # Cerchiamo soggetti con RDF.type in {OWL.ObjectProperty, OWL.DatatypeProperty, RDF.Property}
+    props_found = set()
+    for p in g.subjects(RDF.type, OWL.ObjectProperty):
+        props_found.add(p)
+    for p in g.subjects(RDF.type, OWL.DatatypeProperty):
+        props_found.add(p)
+    for p in g.subjects(RDF.type, RDF.Property):
+        props_found.add(p)
+    props_list = sorted(str(x) for x in props_found)
+    props_list = props_list[:MAX_PROPERTIES]
+    # ====== Troviamo NamedIndividuals e relative triple ======
+    named_inds = set()
+    for s in g.subjects(RDF.type, OWL.NamedIndividual):
+        named_inds.add(s)
+    logger.debug(f"Found {len(named_inds)} individuals.")
+    inds_list = sorted(named_inds)[:MAX_INDIVIDUALS]
+    # Costruisci un testo con le triple di ogni individuo
+    lines_inds = []
+    for ind in inds_list:
+        triple_count = 0
+        for p,o in g.predicate_objects(ind):
+            if triple_count >= MAX_TRIPLES_PER_IND:
+                break
+            s_str = str(ind)[:80]
+            p_str = str(p)[:80]
+            o_str = str(o)[:MAX_LITERAL_CHARS].replace("\n"," ")
+            lines_inds.append(f"{s_str}|{p_str}|{o_str}")
+            triple_count += 1
+    # Ora componiamo la stringa finale
+    txt_classes = "\n".join([f"- CLASSE: {c}" for c in classes_list])
+    txt_props   = "\n".join([f"- PROPRIETA': {p}" for p in props_list])
+    txt_inds    = "\n".join(lines_inds)
+    # Il knowledge_text unisce tre sezioni
+    knowledge_text = f"""\
+# CLASSES (max {MAX_CLASSES})
+{txt_classes}
+# PROPERTIES (max {MAX_PROPERTIES})
+{txt_props}
+# INDIVIDUALS
+{txt_inds}
+"""
+    return knowledge_text
+knowledge_text = extract_ontology_summaries(RDF_FILE)
 def create_system_message(ont_text: str) -> str:
     """
+    Prompt di sistema robusto con regole stringenti:
+    - Query SPARQL su una sola riga
+    - Se 0 results => secondo tentativo
+    - Chat generica => risposte brevi
     """
+    return f"""
+Sei un assistente museale. Qui sotto c'è un riassunto dell'ontologia:
+(1) elenco di classi,
+(2) elenco di proprietà,
+(3) triple relative agli individui (NamedIndividual).
+--- ONTOLOGIA ---
 {ont_text}
+--- FINE ONTOLOGIA ---
+REGOLE FONDAMENTALI:
+1) Se la domanda dell'utente riguarda info contenute in questa ontologia, produci SEMPRE una query SPARQL in UNA SOLA RIGA,
+   con: PREFIX base: <http://www.semanticweb.org/lucreziamosca/ontologies/progettoMuseo#>
+   Esempio:  PREFIX base: <...> SELECT ?x WHERE {{ ... }}
+2) Se la query produce 0 risultati o fallisce, fai un secondo tentativo (magari con FILTER).
+3) Se la domanda è di chat generica (es. ciao come stai?), rispondi breve.
+4) Se trovi risultati, la tua risposta finale dev'essere la query SPARQL su una riga.
+5) Non inventare triple inesistenti. Se non c'è info, di' "Nessuna info."
+6) Non fare risposte multiline per la query. DEVI metterla su una singola riga.
+7) Usa i dati qui sopra. Se la domanda menziona 'David' o 'Amore e Psiche', controlla le triple Individuals.
+FINE REGOLE
+"""
+def create_explanation_prompt(results_str:str)->str:
+    return f"""
+Risultati SPARQL:
 {results_str}
+Fornisci una spiegazione come guida museale, in ~10 righe, riferendo a materiali, autori, periodi,
+senza inventare nulla che non sia presente.
+"""
+async def call_hf_model(messages, temperature=0.7, max_tokens=1024)->str:
+    logging.debug("Chiamo modello HF con i seguenti msg:")
     for m in messages:
+        logging.debug(f"ROLE={m['role']} => {m['content'][:300]}")
     try:
+        resp=client.chat.completions.create(
             model=HF_MODEL,
             messages=messages,
             temperature=temperature,
             max_tokens=max_tokens,
             top_p=0.9
         )
+        raw=resp["choices"][0]["message"]["content"]
         return raw.replace("\n"," ").strip()
     except Exception as e:
         raise HTTPException(status_code=500, detail=str(e))
+app=FastAPI()
 class QueryRequest(BaseModel):
+    message:str
+    max_tokens:int=1024
+    temperature:float=0.5
 @app.post("/generate-response/")
+async def generate_response(req:QueryRequest):
+    user_input=req.message
+    logging.info(f"Utente dice: {user_input}")
+    # 1) Prompt di sistema
+    sys_msg=create_system_message(knowledge_text)
+    msgs=[
+        {"role":"system","content":sys_msg},
         {"role":"user","content":user_input}
     ]
+    # 2) Prima risposta
+    r1=await call_hf_model(msgs, req.temperature, req.max_tokens)
+    logging.info(f"PRIMA RISPOSTA:\n{r1}")
+    # Se non inizia con "PREFIX base:"
+    if not r1.startswith("PREFIX base:"):
+        second_q=f"Non hai risposto con query SPARQL su una sola riga. Ritenta. Domanda: {user_input}"
+        msgs2=[
+            {"role":"system","content":sys_msg},
+            {"role":"assistant","content":r1},
+            {"role":"user","content":second_q}
         ]
+        r2=await call_hf_model(msgs2,req.temperature,req.max_tokens)
+        logging.info(f"SECONDA RISPOSTA:\n{r2}")
+        if r2.startswith("PREFIX base:"):
+            sparql_query=r2
         else:
+            return {"type":"NATURAL","response": r2}
     else:
+        sparql_query=r1
+    # 3) Esegui la query su rdflib
+    g=rdflib.Graph()
     try:
+        g.parse(RDF_FILE,format="xml")
     except Exception as e:
+        return {"type":"ERROR","response":f"Parsing RDF error: {e}"}
     try:
+        results=g.query(sparql_query)
     except Exception as e:
+        # fallback
+        fallback=f"Query fallita. Riprova con altra sintassi. Domanda: {user_input}"
+        msgs3=[
+            {"role":"system","content":sys_msg},
             {"role":"assistant","content":sparql_query},
+            {"role":"user","content":fallback}
         ]
+        r3=await call_hf_model(msgs3,req.temperature,req.max_tokens)
+        if r3.startswith("PREFIX base:"):
+            sparql_query=r3
             try:
+                results=g.query(sparql_query)
             except Exception as e2:
+                return {"type":"ERROR","response":f"Query fallita ancora: {e2}"}
         else:
+            return {"type":"NATURAL","response":r3}
     if len(results)==0:
+        return {"type":"NATURAL","sparql_query":sparql_query,"response":"Nessun risultato."}
+    # 4) Costruisci i result row
+    row_list=[]
     for row in results:
+        row_txt=", ".join([f"{k}:{v}" for k,v in row.asdict().items()])
+        row_list.append(row_txt)
+    results_str="\n".join(row_list)
+    # 5) Spiegazione
+    exp_prompt=create_explanation_prompt(results_str)
+    exp_msgs=[
+        {"role":"system","content":exp_prompt},
         {"role":"user","content":""}
     ]
+    explanation=await call_hf_model(exp_msgs,req.temperature,req.max_tokens)
     return {
         "type":"NATURAL",
+        "sparql_query":sparql_query,
+        "sparql_results":row_list,
+        "explanation":explanation
     }
 @app.get("/")
 def home():
+    return {"msg":"Ok con sunto di classi, proprietà e triple di NamedIndividuals."}