Spaces:

IA2
/

IA2_model

Sleeping

App Files Files Community

AshenClock commited on Jan 3

Commit

dbeb9da

verified ·

1 Parent(s): 30e0c2a

Update app.py

Browse files

Files changed (1) hide show

app.py +17 -25

app.py CHANGED Viewed

@@ -32,7 +32,7 @@ if not API_KEY:
 # Definisci i percorsi dei file
 BASE_DIR = os.path.dirname(os.path.abspath(__file__))
 RDF_FILE = os.path.join(BASE_DIR, "Ontologia.rdf")
-HF_MODEL = "mistralai/Mixtral-8x7B-Instruct-v0.1"  # Modello ottimizzato per seguire istruzioni
 MAX_CLASSES = 30
 MAX_PROPERTIES = 30
@@ -96,7 +96,7 @@ def extract_ontology(rdf_file: str, output_file: str):
         # Estrai le proprietà dell'entità
         entity_properties = {}
         for predicate, obj in g.predicate_objects(entity):
-            if predicate != RDFS.label and predicate != RDFS.comment:
                 entity_properties[str(predicate)] = str(obj)
         entities.append({
             "entity": str(entity),
@@ -111,7 +111,7 @@ def extract_ontology(rdf_file: str, output_file: str):
         "classes": classes[:MAX_CLASSES],
         "properties": properties[:MAX_PROPERTIES],
         "entities": entities,  # Aggiungi le entità
-        "full_ontology": g.serialize(format="xml")  # Decodifica rimossa
     }
     # Salva il documento in JSON
@@ -236,11 +236,11 @@ def extract_classes_and_properties(rdf_file: str) -> str:
     txt_entities = "\n".join([f"- ENTITÀ: {e}" for e in entities_list])
     summary = f"""\
-### CLASSI (max {MAX_CLASSES})
 {txt_classes}
-### PROPRIETÀ (max {MAX_PROPERTIES})
 {txt_props}
-### ENTITÀ (max {MAX_CLASSES})
 {txt_entities}
 """
     logger.info("Estrazione di classi, proprietà ed entità completata.")
@@ -287,18 +287,15 @@ def create_system_message(ont_text: str, retrieved_docs: str) -> str:
     Prompt di sistema robusto, con regole su query in una riga e
     informazioni recuperate tramite RAG.
     """
-    return f"""
-### Istruzioni ###
-Sei un assistente museale esperto in ontologie RDF. Utilizza le informazioni fornite per generare query SPARQL precise e pertinenti.
-### Ontologia ###
 {ont_text}
-### FINE Ontologia ###
 Ecco alcune informazioni rilevanti recuperate dalla base di conoscenza:
 {retrieved_docs}
-### Regole Stringenti ###
 1) Se l'utente chiede informazioni su questa ontologia, genera SEMPRE una query SPARQL in UNA SOLA RIGA, con prefix:
    PREFIX base: <http://www.semanticweb.org/lucreziamosca/ontologies/progettoMuseo#>
 2) La query SPARQL deve essere precisa e cercare esattamente le entità specificate dall'utente. Ad esempio, se l'utente chiede "Chi ha creato l'opera 'Amore e Psiche'?", la query dovrebbe cercare l'opera esattamente con quel nome.
@@ -307,20 +304,15 @@ Ecco alcune informazioni rilevanti recuperate dalla base di conoscenza:
 5) Se trovi risultati, la risposta finale deve essere la query SPARQL (una sola riga).
 6) Se non trovi nulla, rispondi con 'Nessuna info.'
 7) Non multiline. Esempio: PREFIX base: <...> SELECT ?x WHERE { ... }.
-**Esempi:**
 Utente: Chi ha creato l'opera 'Amore e Psiche'?
 Risposta: PREFIX base: <http://www.semanticweb.org/lucreziamosca/ontologies/progettoMuseo#> SELECT ?creatore WHERE { ?opera base:hasName "Amore e Psiche" . ?opera base:creatoDa ?creatore . }
-Utente: che ore sono?
-Risposta: Ciao! Sono un assistente museale e non ho informazioni sulle ore attuali. Ti consiglio di consultare un orologio o un dispositivo mobile per conoscere l'ora esatta.
-### FINE Regole Stringenti ###
 """
 def create_explanation_prompt(results_str: str) -> str:
     """Prompt per generare una spiegazione museale dei risultati SPARQL."""
-    return f"""
 Ho ottenuto questi risultati SPARQL:
 {results_str}
 Ora fornisci una breve spiegazione museale (massimo ~10 righe), senza inventare oltre i risultati.
@@ -473,7 +465,7 @@ async def generate_response(req: QueryRequest):
     row_list = []
     for row in results:
         row_dict = row.asdict()
-        row_str = ", ".join([f"{k}:{v}" for k, v in row_dict.items()])
         row_list.append(row_str)
     results_str = "\n".join(row_list)
@@ -494,4 +486,4 @@ async def generate_response(req: QueryRequest):
 @app.get("/")
 def home():
-    return {"message": "Prompt lascia libertà su come chiamare la proprietà del materiale, ma suggerisce un possibile 'materialeOpera'."}

 # Definisci i percorsi dei file
 BASE_DIR = os.path.dirname(os.path.abspath(__file__))
 RDF_FILE = os.path.join(BASE_DIR, "Ontologia.rdf")
+HF_MODEL = "google/flan-t5-xxl"  # Modello ottimizzato per seguire istruzioni
 MAX_CLASSES = 30
 MAX_PROPERTIES = 30
         # Estrai le proprietà dell'entità
         entity_properties = {}
         for predicate, obj in g.predicate_objects(entity):
+            if predicate not in [RDFS.label, RDFS.comment]:
                 entity_properties[str(predicate)] = str(obj)
         entities.append({
             "entity": str(entity),
         "classes": classes[:MAX_CLASSES],
         "properties": properties[:MAX_PROPERTIES],
         "entities": entities,  # Aggiungi le entità
+        "full_ontology": g.serialize(format="xml").decode('utf-8') if isinstance(g.serialize(format="xml"), bytes) else g.serialize(format="xml")  # Decodifica rimossa
     }
     # Salva il documento in JSON
     txt_entities = "\n".join([f"- ENTITÀ: {e}" for e in entities_list])
     summary = f"""\
+# CLASSI (max {MAX_CLASSES})
 {txt_classes}
+# PROPRIETÀ (max {MAX_PROPERTIES})
 {txt_props}
+# ENTITÀ (max {MAX_CLASSES})
 {txt_entities}
 """
     logger.info("Estrazione di classi, proprietà ed entità completata.")
     Prompt di sistema robusto, con regole su query in una riga e
     informazioni recuperate tramite RAG.
     """
+    return f"""\
+Sei un assistente museale esperto in ontologie RDF. Utilizza le informazioni fornite per generare query SPARQL precise e pertinenti. Ecco un estratto di CLASSI, PROPRIETÀ ed ENTità dell'ontologia (senza NamedIndividuals):
+--- ONTOLOGIA ---
 {ont_text}
+--- FINE ---
 Ecco alcune informazioni rilevanti recuperate dalla base di conoscenza:
 {retrieved_docs}
+Suggerimento: se l'utente chiede il 'materiale' di un'opera, potresti usare qualcosa come 'base:materialeOpera' o un'altra proprietà simile (se esiste). Non è tassativo: usa la proprietà che ritieni più affine se ci sono riferimenti in ontologia.
+REGOLE STRINGENTI:
 1) Se l'utente chiede informazioni su questa ontologia, genera SEMPRE una query SPARQL in UNA SOLA RIGA, con prefix:
    PREFIX base: <http://www.semanticweb.org/lucreziamosca/ontologies/progettoMuseo#>
 2) La query SPARQL deve essere precisa e cercare esattamente le entità specificate dall'utente. Ad esempio, se l'utente chiede "Chi ha creato l'opera 'Amore e Psiche'?", la query dovrebbe cercare l'opera esattamente con quel nome.
 5) Se trovi risultati, la risposta finale deve essere la query SPARQL (una sola riga).
 6) Se non trovi nulla, rispondi con 'Nessuna info.'
 7) Non multiline. Esempio: PREFIX base: <...> SELECT ?x WHERE { ... }.
+Esempio:
 Utente: Chi ha creato l'opera 'Amore e Psiche'?
 Risposta: PREFIX base: <http://www.semanticweb.org/lucreziamosca/ontologies/progettoMuseo#> SELECT ?creatore WHERE { ?opera base:hasName "Amore e Psiche" . ?opera base:creatoDa ?creatore . }
+FINE REGOLE
 """
 def create_explanation_prompt(results_str: str) -> str:
     """Prompt per generare una spiegazione museale dei risultati SPARQL."""
+    return f"""\
 Ho ottenuto questi risultati SPARQL:
 {results_str}
 Ora fornisci una breve spiegazione museale (massimo ~10 righe), senza inventare oltre i risultati.
     row_list = []
     for row in results:
         row_dict = row.asdict()
+        row_str = ", ".join([f"{k}: {v}" for k, v in row_dict.items()])
         row_list.append(row_str)
     results_str = "\n".join(row_list)
 @app.get("/")
 def home():
+    return {"message": "Assistente Museale con supporto SPARQL."}