Spaces:

IA2
/

IA2_model

Sleeping

App Files Files Community

AshenClock commited on Jan 3

Commit

30e0c2a

verified ·

1 Parent(s): 99a1a6f

Update app.py

Browse files

Files changed (1) hide show

app.py +42 -26

app.py CHANGED Viewed

@@ -32,7 +32,7 @@ if not API_KEY:
 # Definisci i percorsi dei file
 BASE_DIR = os.path.dirname(os.path.abspath(__file__))
 RDF_FILE = os.path.join(BASE_DIR, "Ontologia.rdf")
-HF_MODEL = "NousResearch/Hermes-3-Llama-3.1-8B"  # Assicurati che il modello sia supportato
 MAX_CLASSES = 30
 MAX_PROPERTIES = 30
@@ -133,7 +133,7 @@ def create_faiss_index(documents_file: str, index_file: str, embedding_model: st
         with open(documents_file, "r", encoding="utf-8") as f:
             document = json.load(f)
         logger.info(f"Documento caricato da {documents_file}.")
         # Genera embedding
         model = SentenceTransformer(embedding_model)
         # Concatenazione delle classi, proprietà e entità per l'embedding
@@ -142,13 +142,13 @@ def create_faiss_index(documents_file: str, index_file: str, embedding_model: st
         texts += [f"Entità: {entity['label']}. Descrizione: {entity['description']}. Proprietà: {entity['properties']}" for entity in document.get('entities', [])]
         embeddings = model.encode(texts, convert_to_numpy=True)
         logger.info("Embedding generati con SentenceTransformer.")
         # Crea l'indice FAISS
         dimension = embeddings.shape[1]
         index = faiss.IndexFlatL2(dimension)
         index.add(embeddings)
         logger.info(f"Indice FAISS creato con dimensione: {dimension}.")
         # Salva l'indice
         faiss.write_index(index, index_file)
         logger.info(f"Indice FAISS salvato in {index_file}.")
@@ -236,11 +236,11 @@ def extract_classes_and_properties(rdf_file: str) -> str:
     txt_entities = "\n".join([f"- ENTITÀ: {e}" for e in entities_list])
     summary = f"""\
-# CLASSI (max {MAX_CLASSES})
 {txt_classes}
-# PROPRIETÀ (max {MAX_PROPERTIES})
 {txt_props}
-# ENTITÀ (max {MAX_CLASSES})
 {txt_entities}
 """
     logger.info("Estrazione di classi, proprietà ed entità completata.")
@@ -254,25 +254,25 @@ def retrieve_relevant_documents(query: str, top_k: int = 5):
         with open(DOCUMENTS_FILE, "r", encoding="utf-8") as f:
             document = json.load(f)
         logger.info(f"Documento caricato da {DOCUMENTS_FILE}.")
         # Carica l'indice FAISS
         index = faiss.read_index(FAISS_INDEX_FILE)
         logger.info(f"Indice FAISS caricato da {FAISS_INDEX_FILE}.")
         # Genera embedding della query
         model = SentenceTransformer('all-MiniLM-L6-v2')
         query_embedding = model.encode([query], convert_to_numpy=True)
         logger.info("Embedding della query generati.")
         # Ricerca nell'indice
         distances, indices = index.search(query_embedding, top_k)
         logger.info(f"Ricerca FAISS completata. Risultati ottenuti: {len(indices[0])}")
         # Concatenazione delle descrizioni per la ricerca
         texts = [f"Classe: {cls['label']}. Descrizione: {cls['description']}" for cls in document['classes']]
         texts += [f"Proprietà: {prop['label']}. Descrizione: {prop['description']}" for prop in document['properties']]
         texts += [f"Entità: {entity['label']}. Descrizione: {entity['description']}. Proprietà: {entity['properties']}" for entity in document.get('entities', [])]
         # Recupera i testi rilevanti
         relevant_texts = [texts[idx] for idx in indices[0] if idx < len(texts)]
         retrieved_docs = "\n".join(relevant_texts)
@@ -288,15 +288,17 @@ def create_system_message(ont_text: str, retrieved_docs: str) -> str:
     informazioni recuperate tramite RAG.
     """
     return f"""
-Sei un assistente museale esperto in ontologie RDF. Utilizza le informazioni fornite per generare query SPARQL precise e pertinenti. Ecco un estratto di CLASSI, PROPRIETÀ ed ENTità dell'ontologia (senza NamedIndividuals):
---- ONTOLOGIA ---
 {ont_text}
---- FINE ---
 Ecco alcune informazioni rilevanti recuperate dalla base di conoscenza:
 {retrieved_docs}
-Suggerimento: se l'utente chiede il 'materiale' di un'opera, potresti usare qualcosa come 'base:materialeOpera' o un'altra proprietà simile (se esiste). Non è tassativo: usa la proprietà che ritieni più affine se ci sono riferimenti in ontologia.
-REGOLE STRINGENTI:
 1) Se l'utente chiede informazioni su questa ontologia, genera SEMPRE una query SPARQL in UNA SOLA RIGA, con prefix:
    PREFIX base: <http://www.semanticweb.org/lucreziamosca/ontologies/progettoMuseo#>
 2) La query SPARQL deve essere precisa e cercare esattamente le entità specificate dall'utente. Ad esempio, se l'utente chiede "Chi ha creato l'opera 'Amore e Psiche'?", la query dovrebbe cercare l'opera esattamente con quel nome.
@@ -304,13 +306,16 @@ REGOLE STRINGENTI:
 4) Se la domanda è generica (tipo 'Ciao, come stai?'), rispondi breve.
 5) Se trovi risultati, la risposta finale deve essere la query SPARQL (una sola riga).
 6) Se non trovi nulla, rispondi con 'Nessuna info.'
-7) Non multiline. Esempio: PREFIX base: <...> SELECT ?x WHERE {{ ... }}.
-Esempio:
 Utente: Chi ha creato l'opera 'Amore e Psiche'?
-Risposta: PREFIX base: <http://www.semanticweb.org/lucreziamosca/ontologies/progettoMuseo#> SELECT ?creatore WHERE {{ ?opera base:hasName "Amore e Psiche" . ?opera base:creatoDa ?creatore . }}
-FINE REGOLE
 """
 def create_explanation_prompt(results_str: str) -> str:
@@ -321,12 +326,12 @@ Ho ottenuto questi risultati SPARQL:
 Ora fornisci una breve spiegazione museale (massimo ~10 righe), senza inventare oltre i risultati.
 """
-async def call_hf_model(prompt: str, temperature: float = 0.5, max_tokens: int = 1024) -> str:
     """Chiama il modello Hugging Face tramite l'API REST e gestisce la risposta."""
     logger.debug("Chiamo HF con il seguente prompt:")
     content_preview = (prompt[:300] + '...') if len(prompt) > 300 else prompt
     logger.debug(f"PROMPT => {content_preview}")
     headers = {
         "Authorization": f"Bearer {API_KEY}"
     }
@@ -338,7 +343,7 @@ async def call_hf_model(prompt: str, temperature: float = 0.5, max_tokens: int =
             "top_p": 0.9
         }
     }
     try:
         response = requests.post(
             f"https://api-inference.huggingface.co/models/{HF_MODEL}",
@@ -356,7 +361,7 @@ async def call_hf_model(prompt: str, temperature: float = 0.5, max_tokens: int =
             raw = data["generated_text"]
         else:
             raise ValueError("Nessun campo 'generated_text' nella risposta.")
         # Forza la risposta su una singola linea se multilinea
         single_line = " ".join(raw.splitlines())
         logger.debug(f"Risposta HF single-line: {single_line}")
@@ -365,6 +370,11 @@ async def call_hf_model(prompt: str, temperature: float = 0.5, max_tokens: int =
         logger.error(f"Errore nella chiamata all'API Hugging Face tramite requests: {e}")
         raise HTTPException(status_code=500, detail=str(e))
 # Prepara i file necessari per RAG
 prepare_retrieval()
@@ -375,7 +385,7 @@ app = FastAPI()
 class QueryRequest(BaseModel):
     message: str
-    max_tokens: int = 1024
     temperature: float = 0.5
 @app.post("/generate-response/")
@@ -383,6 +393,12 @@ async def generate_response(req: QueryRequest):
     user_input = req.message
     logger.info(f"Utente dice: {user_input}")
     try:
         # Recupera documenti rilevanti usando RAG
         retrieved_docs = retrieve_relevant_documents(user_input, top_k=3)

 # Definisci i percorsi dei file
 BASE_DIR = os.path.dirname(os.path.abspath(__file__))
 RDF_FILE = os.path.join(BASE_DIR, "Ontologia.rdf")
+HF_MODEL = "mistralai/Mixtral-8x7B-Instruct-v0.1"  # Modello ottimizzato per seguire istruzioni
 MAX_CLASSES = 30
 MAX_PROPERTIES = 30
         with open(documents_file, "r", encoding="utf-8") as f:
             document = json.load(f)
         logger.info(f"Documento caricato da {documents_file}.")
         # Genera embedding
         model = SentenceTransformer(embedding_model)
         # Concatenazione delle classi, proprietà e entità per l'embedding
         texts += [f"Entità: {entity['label']}. Descrizione: {entity['description']}. Proprietà: {entity['properties']}" for entity in document.get('entities', [])]
         embeddings = model.encode(texts, convert_to_numpy=True)
         logger.info("Embedding generati con SentenceTransformer.")
         # Crea l'indice FAISS
         dimension = embeddings.shape[1]
         index = faiss.IndexFlatL2(dimension)
         index.add(embeddings)
         logger.info(f"Indice FAISS creato con dimensione: {dimension}.")
         # Salva l'indice
         faiss.write_index(index, index_file)
         logger.info(f"Indice FAISS salvato in {index_file}.")
     txt_entities = "\n".join([f"- ENTITÀ: {e}" for e in entities_list])
     summary = f"""\
+### CLASSI (max {MAX_CLASSES})
 {txt_classes}
+### PROPRIETÀ (max {MAX_PROPERTIES})
 {txt_props}
+### ENTITÀ (max {MAX_CLASSES})
 {txt_entities}
 """
     logger.info("Estrazione di classi, proprietà ed entità completata.")
         with open(DOCUMENTS_FILE, "r", encoding="utf-8") as f:
             document = json.load(f)
         logger.info(f"Documento caricato da {DOCUMENTS_FILE}.")
         # Carica l'indice FAISS
         index = faiss.read_index(FAISS_INDEX_FILE)
         logger.info(f"Indice FAISS caricato da {FAISS_INDEX_FILE}.")
         # Genera embedding della query
         model = SentenceTransformer('all-MiniLM-L6-v2')
         query_embedding = model.encode([query], convert_to_numpy=True)
         logger.info("Embedding della query generati.")
         # Ricerca nell'indice
         distances, indices = index.search(query_embedding, top_k)
         logger.info(f"Ricerca FAISS completata. Risultati ottenuti: {len(indices[0])}")
         # Concatenazione delle descrizioni per la ricerca
         texts = [f"Classe: {cls['label']}. Descrizione: {cls['description']}" for cls in document['classes']]
         texts += [f"Proprietà: {prop['label']}. Descrizione: {prop['description']}" for prop in document['properties']]
         texts += [f"Entità: {entity['label']}. Descrizione: {entity['description']}. Proprietà: {entity['properties']}" for entity in document.get('entities', [])]
         # Recupera i testi rilevanti
         relevant_texts = [texts[idx] for idx in indices[0] if idx < len(texts)]
         retrieved_docs = "\n".join(relevant_texts)
     informazioni recuperate tramite RAG.
     """
     return f"""
+### Istruzioni ###
+Sei un assistente museale esperto in ontologie RDF. Utilizza le informazioni fornite per generare query SPARQL precise e pertinenti.
+### Ontologia ###
 {ont_text}
+### FINE Ontologia ###
 Ecco alcune informazioni rilevanti recuperate dalla base di conoscenza:
 {retrieved_docs}
+### Regole Stringenti ###
 1) Se l'utente chiede informazioni su questa ontologia, genera SEMPRE una query SPARQL in UNA SOLA RIGA, con prefix:
    PREFIX base: <http://www.semanticweb.org/lucreziamosca/ontologies/progettoMuseo#>
 2) La query SPARQL deve essere precisa e cercare esattamente le entità specificate dall'utente. Ad esempio, se l'utente chiede "Chi ha creato l'opera 'Amore e Psiche'?", la query dovrebbe cercare l'opera esattamente con quel nome.
 4) Se la domanda è generica (tipo 'Ciao, come stai?'), rispondi breve.
 5) Se trovi risultati, la risposta finale deve essere la query SPARQL (una sola riga).
 6) Se non trovi nulla, rispondi con 'Nessuna info.'
+7) Non multiline. Esempio: PREFIX base: <...> SELECT ?x WHERE { ... }.
+**Esempi:**
 Utente: Chi ha creato l'opera 'Amore e Psiche'?
+Risposta: PREFIX base: <http://www.semanticweb.org/lucreziamosca/ontologies/progettoMuseo#> SELECT ?creatore WHERE { ?opera base:hasName "Amore e Psiche" . ?opera base:creatoDa ?creatore . }
+Utente: che ore sono?
+Risposta: Ciao! Sono un assistente museale e non ho informazioni sulle ore attuali. Ti consiglio di consultare un orologio o un dispositivo mobile per conoscere l'ora esatta.
+### FINE Regole Stringenti ###
 """
 def create_explanation_prompt(results_str: str) -> str:
 Ora fornisci una breve spiegazione museale (massimo ~10 righe), senza inventare oltre i risultati.
 """
+async def call_hf_model(prompt: str, temperature: float = 0.5, max_tokens: int = 150) -> str:
     """Chiama il modello Hugging Face tramite l'API REST e gestisce la risposta."""
     logger.debug("Chiamo HF con il seguente prompt:")
     content_preview = (prompt[:300] + '...') if len(prompt) > 300 else prompt
     logger.debug(f"PROMPT => {content_preview}")
     headers = {
         "Authorization": f"Bearer {API_KEY}"
     }
             "top_p": 0.9
         }
     }
     try:
         response = requests.post(
             f"https://api-inference.huggingface.co/models/{HF_MODEL}",
             raw = data["generated_text"]
         else:
             raise ValueError("Nessun campo 'generated_text' nella risposta.")
         # Forza la risposta su una singola linea se multilinea
         single_line = " ".join(raw.splitlines())
         logger.debug(f"Risposta HF single-line: {single_line}")
         logger.error(f"Errore nella chiamata all'API Hugging Face tramite requests: {e}")
         raise HTTPException(status_code=500, detail=str(e))
+def is_ontology_related(query: str) -> bool:
+    """Determina se la domanda è pertinente all'ontologia."""
+    keywords = ["opera", "museo", "stanza", "tour", "visitatore", "biglietto", "guida", "evento", "agente"]
+    return any(keyword.lower() in query.lower() for keyword in keywords)
 # Prepara i file necessari per RAG
 prepare_retrieval()
 class QueryRequest(BaseModel):
     message: str
+    max_tokens: int = 150  # Ridotto per risposte concise
     temperature: float = 0.5
 @app.post("/generate-response/")
     user_input = req.message
     logger.info(f"Utente dice: {user_input}")
+    if not is_ontology_related(user_input):
+        return {
+            "type": "NATURAL",
+            "response": "Ciao! Sono un assistente museale e non ho informazioni sulle ore attuali. Ti consiglio di consultare un orologio o un dispositivo mobile per conoscere l'ora esatta."
+        }
     try:
         # Recupera documenti rilevanti usando RAG
         retrieved_docs = retrieve_relevant_documents(user_input, top_k=3)