Spaces:

IA2
/

IA2_model

Sleeping

App Files Files Community

AshenClock commited on Jan 4

Commit

964c6d4

verified ·

1 Parent(s): 2ecaeb3

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -10

app.py CHANGED Viewed

@@ -81,17 +81,17 @@ def create_faiss_index(documents_file: str, index_file: str, embedding_model_ins
             document = json.load(f)
         lines = document['lines']
         logger.info(f"{len(lines)} linee caricate da {documents_file}.")
         # Genera embedding
         embeddings = embedding_model_instance.encode(lines, convert_to_numpy=True, show_progress_bar=True)
         logger.info("Embedding generati con SentenceTransformer.")
         # Crea l'indice FAISS
         dimension = embeddings.shape[1]
         index = faiss.IndexFlatL2(dimension)
         index.add(embeddings)
         logger.info(f"Indice FAISS creato con dimensione: {dimension}.")
         # Salva l'indice
         faiss.write_index(index, index_file)
         logger.info(f"Indice FAISS salvato in {index_file}.")
@@ -142,23 +142,23 @@ def retrieve_relevant_lines(query: str, top_k: int = 5, embedding_model_instance
             document = json.load(f)
         lines = document['lines']
         logger.info(f"{len(lines)} linee caricate da {DOCUMENTS_FILE}.")
         # Carica l'indice FAISS
         index = faiss.read_index(FAISS_INDEX_FILE)
         logger.info(f"Indice FAISS caricato da {FAISS_INDEX_FILE}.")
         # Genera embedding della query
         if embedding_model_instance is None:
             embedding_model_instance = SentenceTransformer('all-MiniLM-L6-v2')
             logger.info("Modello SentenceTransformer caricato per l'embedding della query.")
         query_embedding = embedding_model_instance.encode([query], convert_to_numpy=True)
         logger.info("Embedding della query generati.")
         # Ricerca nell'indice
         distances, indices = index.search(query_embedding, top_k)
         logger.info(f"Ricerca FAISS completata. Risultati ottenuti: {len(indices[0])}")
         # Recupera le linee rilevanti
         relevant_texts = [lines[idx] for idx in indices[0] if idx < len(lines)]
         retrieved_docs = "\n".join(relevant_texts)
@@ -188,10 +188,10 @@ Sei un assistente museale esperto in ontologie RDF. Utilizza le informazioni for
 4) Se la domanda è generica (tipo 'Ciao, come stai?'), rispondi brevemente.
 5) Se trovi risultati, la risposta finale deve essere la query SPARQL (una sola riga).
 6) Se non trovi nulla, rispondi con 'Nessuna info.'
-7) Non multiline. Esempio: PREFIX base: <...> SELECT ?x WHERE { ... }.
 Esempio:
 Utente: Chi ha creato l'opera 'Amore e Psiche'?
-Risposta: PREFIX base: <http://www.semanticweb.org/lucreziamosca/ontologies/progettoMuseo#> SELECT ?creatore WHERE { ?opera base:hasName "Amore e Psiche" . ?opera base:creatoDa ?creatore . }
 ### FINE REGOLE ###
 ### Conversazione ###

             document = json.load(f)
         lines = document['lines']
         logger.info(f"{len(lines)} linee caricate da {documents_file}.")
         # Genera embedding
         embeddings = embedding_model_instance.encode(lines, convert_to_numpy=True, show_progress_bar=True)
         logger.info("Embedding generati con SentenceTransformer.")
         # Crea l'indice FAISS
         dimension = embeddings.shape[1]
         index = faiss.IndexFlatL2(dimension)
         index.add(embeddings)
         logger.info(f"Indice FAISS creato con dimensione: {dimension}.")
         # Salva l'indice
         faiss.write_index(index, index_file)
         logger.info(f"Indice FAISS salvato in {index_file}.")
             document = json.load(f)
         lines = document['lines']
         logger.info(f"{len(lines)} linee caricate da {DOCUMENTS_FILE}.")
         # Carica l'indice FAISS
         index = faiss.read_index(FAISS_INDEX_FILE)
         logger.info(f"Indice FAISS caricato da {FAISS_INDEX_FILE}.")
         # Genera embedding della query
         if embedding_model_instance is None:
             embedding_model_instance = SentenceTransformer('all-MiniLM-L6-v2')
             logger.info("Modello SentenceTransformer caricato per l'embedding della query.")
         query_embedding = embedding_model_instance.encode([query], convert_to_numpy=True)
         logger.info("Embedding della query generati.")
         # Ricerca nell'indice
         distances, indices = index.search(query_embedding, top_k)
         logger.info(f"Ricerca FAISS completata. Risultati ottenuti: {len(indices[0])}")
         # Recupera le linee rilevanti
         relevant_texts = [lines[idx] for idx in indices[0] if idx < len(lines)]
         retrieved_docs = "\n".join(relevant_texts)
 4) Se la domanda è generica (tipo 'Ciao, come stai?'), rispondi brevemente.
 5) Se trovi risultati, la risposta finale deve essere la query SPARQL (una sola riga).
 6) Se non trovi nulla, rispondi con 'Nessuna info.'
+7) Non multiline. Esempio: PREFIX base: <...> SELECT ?x WHERE {{ ... }}.
 Esempio:
 Utente: Chi ha creato l'opera 'Amore e Psiche'?
+Risposta: PREFIX base: <http://www.semanticweb.org/lucreziamosca/ontologies/progettoMuseo#> SELECT ?creatore WHERE {{ ?opera base:hasName "Amore e Psiche" . ?opera base:creatoDa ?creatore . }}
 ### FINE REGOLE ###
 ### Conversazione ###