AshenClock commited on
Commit
fe3bdda
·
verified ·
1 Parent(s): c191446

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +115 -41
app.py CHANGED
@@ -1,36 +1,81 @@
1
- import json
2
  import os
3
- from pathlib import Path
4
- from huggingface_hub import InferenceClient
5
  from rdflib import Graph
6
  from pydantic import BaseModel
7
  from fastapi import FastAPI, HTTPException
8
- import logging
9
 
 
10
  logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
11
  logger = logging.getLogger(__name__)
12
 
 
13
  API_KEY = os.getenv("HF_API_KEY")
14
  client = InferenceClient(api_key=API_KEY)
15
 
 
16
  RDF_FILE = "Ontologia.rdf"
17
 
18
- # Funzione di validazione
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
19
  def validate_sparql_query(query: str, rdf_file_path: str) -> bool:
 
 
 
 
20
  g = Graph()
21
  try:
22
  g.parse(rdf_file_path, format="xml")
23
- g.query(query) # Se c'è un errore di sintassi o referenza, solleva eccezione
24
  return True
25
  except Exception as e:
26
  logger.error(f"Errore durante la validazione della query SPARQL: {e}")
27
  return False
28
 
29
- # Prompt di sistema "stringente"
 
 
30
  def create_system_message(rdf_context: str) -> str:
31
  """
32
- Prompt di sistema estremamente rigido, che forza il modello
33
- a usare solo il prefisso definito e a generare la query in un'unica riga.
 
 
 
34
  """
35
  return f"""
36
  Sei un assistente esperto nella generazione di query SPARQL basate su un'ontologia RDF.
@@ -53,13 +98,32 @@ DI SEGUITO LE REGOLE TASSATIVE:
53
  "Non posso generare una query SPARQL per questa richiesta."
54
 
55
  Esempio di query corretta (fittizia) in una sola riga:
56
- PREFIX base: <http://www.semanticweb.org/lucreziamosca/ontologies/2024/11/untitled-ontology-39/> SELECT ?stanza WHERE { ?stanza a base:Stanza . } LIMIT 10
57
 
58
- RISPONDI ESCLUSIVAMENTE CON LA QUERY O IL MESSAGGIO DI IMPOSSIBILITA'.
59
- NON SCRIVERE NESSUN COMMENTO AGGIUNTIVO.
60
  """
61
-
62
- # Funzione per chiamare il modello su Hugging Face
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
63
  async def call_model(messages, temperature=0.7, max_tokens=2048):
64
  try:
65
  response = client.chat.completions.create(
@@ -71,18 +135,16 @@ async def call_model(messages, temperature=0.7, max_tokens=2048):
71
  stream=False
72
  )
73
  raw_text = response["choices"][0]["message"]["content"]
 
74
  return raw_text.replace("\n", " ").strip()
75
  except Exception as e:
76
  logger.error(f"Errore nel modello: {e}")
77
  raise HTTPException(status_code=500, detail=str(e))
78
 
79
- # Caricamento di un riassunto dell'ontologia (semplificato per brevità)
80
- def load_rdf_summary() -> str:
81
- # Qui un caricamento minimo o un testo statico
82
- return "Classi e proprietà dell'ontologia: base:Stanza, base:Contiene, base:Opera, ecc."
83
-
84
  app = FastAPI()
85
- rdf_context = load_rdf_summary()
86
 
87
  class QueryRequest(BaseModel):
88
  message: str
@@ -94,35 +156,48 @@ async def generate_query(request: QueryRequest):
94
  # 1) Prima iterazione
95
  system_msg = create_system_message(rdf_context)
96
  user_msg = request.message
97
- messages = [
 
98
  {"role": "system", "content": system_msg},
99
- {"role": "user", "content": user_msg},
100
  ]
101
- response1 = await call_model(messages, request.temperature, request.max_tokens)
102
  logger.info(f"[Prima iterazione] Risposta generata dal modello: {response1}")
103
 
104
- # 2) Validazione
105
- if not (response1.startswith("PREFIX") and ("SELECT" in response1 or "ASK" in response1)):
106
- # Fallimento immediato
107
- return {"query": None, "explanation": "La query non rispetta le regole base (PREFIX + SELECT/ASK)."}
108
-
 
 
 
 
109
  if validate_sparql_query(response1, RDF_FILE):
110
- # Query valida! Restituisco la prima
111
  return {"query": response1, "explanation": "Query valida alla prima iterazione."}
112
  else:
113
- # 3) Seconda iterazione “correttiva”
114
- correction_msg = create_correction_message(rdf_context, "Errore di validazione (prima iterazione).")
115
- messages2 = [
116
- {"role": "system", "content": system_msg}, # Sistema invariato
117
- {"role": "assistant", "content": response1}, # Metti la risposta errata in contesto
118
- {"role": "system", "content": correction_msg}, # Istruzione di correzione
 
119
  ]
120
- response2 = await call_model(messages2, request.temperature, request.max_tokens)
121
  logger.info(f"[Seconda iterazione] Risposta generata dal modello: {response2}")
122
 
123
- if not (response2.startswith("PREFIX") and ("SELECT" in response2 or "ASK" in response2)):
124
- return {"query": None, "explanation": "Anche la seconda query non rispetta le regole (PREFIX + SELECT/ASK)."}
125
-
 
 
 
 
 
 
 
 
126
  if validate_sparql_query(response2, RDF_FILE):
127
  return {"query": response2, "explanation": "Query valida alla seconda iterazione (corretta)."}
128
  else:
@@ -133,5 +208,4 @@ async def generate_query(request: QueryRequest):
133
 
134
  @app.get("/")
135
  async def root():
136
- return {"message": "Server attivo per generare query SPARQL"}
137
-
 
 
1
  import os
2
+ import logging
 
3
  from rdflib import Graph
4
  from pydantic import BaseModel
5
  from fastapi import FastAPI, HTTPException
6
+ from huggingface_hub import InferenceClient
7
 
8
+ # Configurazione logging
9
  logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
10
  logger = logging.getLogger(__name__)
11
 
12
+ # Configurazione API Hugging Face
13
  API_KEY = os.getenv("HF_API_KEY")
14
  client = InferenceClient(api_key=API_KEY)
15
 
16
+ # File RDF
17
  RDF_FILE = "Ontologia.rdf"
18
 
19
+ ####################################
20
+ # Caricamento RDF (riassunto)
21
+ ####################################
22
+ def load_rdf_summary():
23
+ """
24
+ Carica un riassunto dell'ontologia dal file RDF (se necessario).
25
+ Qui puoi usare parse e scansionare classi e proprietà reali.
26
+ """
27
+ if not os.path.exists(RDF_FILE):
28
+ return "Nessun file RDF trovato."
29
+ try:
30
+ g = Graph()
31
+ g.parse(RDF_FILE, format="xml")
32
+
33
+ # Esempio di estrazione semplificata di classi e proprietà
34
+ classes = set()
35
+ properties = set()
36
+ for s, p, o in g.triples((None, None, None)):
37
+ if "Class" in str(o):
38
+ classes.add(s)
39
+ if "Property" in str(o):
40
+ properties.add(s)
41
+
42
+ class_summary = "\n".join([f"- Classe: {cls}" for cls in classes])
43
+ prop_summary = "\n".join([f"- Proprietà: {prop}" for prop in properties])
44
+ return f"Classi:\n{class_summary}\n\nProprietà:\n{prop_summary}"
45
+ except Exception as e:
46
+ logger.error(f"Errore durante il parsing del file RDF: {e}")
47
+ return "Errore nel caricamento del file RDF."
48
+
49
+ rdf_context = load_rdf_summary()
50
+ logger.info("RDF Summary: %s", rdf_context)
51
+
52
+ ####################################
53
+ # Validazione SPARQL
54
+ ####################################
55
  def validate_sparql_query(query: str, rdf_file_path: str) -> bool:
56
+ """
57
+ Esegue il parsing e l'esecuzione di test della query su RDF,
58
+ per verificare che sia sintatticamente e semanticamente corretta.
59
+ """
60
  g = Graph()
61
  try:
62
  g.parse(rdf_file_path, format="xml")
63
+ g.query(query) # Se c'è errore di sintassi o referenza, solleva eccezione
64
  return True
65
  except Exception as e:
66
  logger.error(f"Errore durante la validazione della query SPARQL: {e}")
67
  return False
68
 
69
+ ####################################
70
+ # Prompt di Sistema molto stringente
71
+ ####################################
72
  def create_system_message(rdf_context: str) -> str:
73
  """
74
+ Prompt di sistema estremo:
75
+ - impone l'uso di un SOLO prefisso
76
+ - vieta righe multiple
77
+ - vieta di inventare prefissi
78
+ - obbliga a iniziare con `PREFIX base: ... SELECT` o `ASK`
79
  """
80
  return f"""
81
  Sei un assistente esperto nella generazione di query SPARQL basate su un'ontologia RDF.
 
98
  "Non posso generare una query SPARQL per questa richiesta."
99
 
100
  Esempio di query corretta (fittizia) in una sola riga:
101
+ PREFIX base: <http://www.semanticweb.org/lucreziamosca/ontologies/2024/11/untitled-ontology-39/> SELECT ?stanza WHERE {{ ?stanza a base:Stanza . }} LIMIT 10
102
 
103
+ RISPONDI ESCLUSIVAMENTE CON LA QUERY O IL MESSAGGIO DI IMPOSSIBILITA'.
 
104
  """
105
+
106
+ ####################################
107
+ # Prompt di "correzione"
108
+ ####################################
109
+ def create_correction_message(rdf_context: str, errore: str) -> str:
110
+ """
111
+ Questo prompt serve per la seconda iterazione se la query non è valida.
112
+ Invita a correggere la query e a rispettare le regole.
113
+ """
114
+ return f"""
115
+ La query che hai fornito è risultata NON valida per il seguente motivo:
116
+ {errore}
117
+
118
+ RICORDA LE REGOLE TASSATIVE, in particolare l'uso ESATTO del prefisso:
119
+ PREFIX base: <http://www.semanticweb.org/lucreziamosca/ontologies/2024/11/untitled-ontology-39/>
120
+ Riscrivi la query in UNA SOLA RIGA, rispettando la sintassi SPARQL e usando solo classi e proprietà presenti nell'ontologia.
121
+ Se non riesci, dì: "Non posso generare una query SPARQL per questa richiesta."
122
+ """
123
+
124
+ ####################################
125
+ # Funzione per chiamare il modello
126
+ ####################################
127
  async def call_model(messages, temperature=0.7, max_tokens=2048):
128
  try:
129
  response = client.chat.completions.create(
 
135
  stream=False
136
  )
137
  raw_text = response["choices"][0]["message"]["content"]
138
+ # Rimuoviamo eventuali newline per forzare la singola riga
139
  return raw_text.replace("\n", " ").strip()
140
  except Exception as e:
141
  logger.error(f"Errore nel modello: {e}")
142
  raise HTTPException(status_code=500, detail=str(e))
143
 
144
+ ####################################
145
+ # FastAPI
146
+ ####################################
 
 
147
  app = FastAPI()
 
148
 
149
  class QueryRequest(BaseModel):
150
  message: str
 
156
  # 1) Prima iterazione
157
  system_msg = create_system_message(rdf_context)
158
  user_msg = request.message
159
+
160
+ messages_first = [
161
  {"role": "system", "content": system_msg},
162
+ {"role": "user", "content": user_msg}
163
  ]
164
+ response1 = await call_model(messages_first, request.temperature, request.max_tokens)
165
  logger.info(f"[Prima iterazione] Risposta generata dal modello: {response1}")
166
 
167
+ # Controllo se comincia con il prefisso esatto
168
+ mandated_prefix = "PREFIX base: <http://www.semanticweb.org/lucreziamosca/ontologies/2024/11/untitled-ontology-39/>"
169
+ if not (response1.startswith(mandated_prefix + " SELECT") or response1.startswith(mandated_prefix + " ASK")):
170
+ return {
171
+ "query": None,
172
+ "explanation": "Il modello non ha usato il prefisso obbligatorio o non ha usato SELECT/ASK."
173
+ }
174
+
175
+ # Verifichiamo se la query è valida
176
  if validate_sparql_query(response1, RDF_FILE):
 
177
  return {"query": response1, "explanation": "Query valida alla prima iterazione."}
178
  else:
179
+ # 2) Seconda iterazione (correzione)
180
+ correction_msg = create_correction_message(rdf_context, "Query non valida alla prima iterazione.")
181
+ # Comunichiamo al modello la query precedente come contesto e chiediamo la correzione
182
+ messages_second = [
183
+ {"role": "system", "content": system_msg}, # Prompt di sistema invariato
184
+ {"role": "assistant", "content": response1}, # La risposta 'errata'
185
+ {"role": "system", "content": correction_msg} # Istruzione di correzione
186
  ]
187
+ response2 = await call_model(messages_second, request.temperature, request.max_tokens)
188
  logger.info(f"[Seconda iterazione] Risposta generata dal modello: {response2}")
189
 
190
+ # Ricontrollo se comincia con il prefisso esatto
191
+ if not (response2.startswith(mandated_prefix + " SELECT") and not response2.startswith(mandated_prefix + " ASK")):
192
+ # O se manca la SELECT e l'ASK
193
+ # Con un piccolo fix: potresti voler controllare sia SELECT che ASK qui
194
+ if not (response2.startswith(mandated_prefix + " SELECT") or response2.startswith(mandated_prefix + " ASK")):
195
+ return {
196
+ "query": None,
197
+ "explanation": "Anche la seconda iterazione non ha usato il prefisso e SELECT/ASK corretti."
198
+ }
199
+
200
+ # Validazione della seconda risposta
201
  if validate_sparql_query(response2, RDF_FILE):
202
  return {"query": response2, "explanation": "Query valida alla seconda iterazione (corretta)."}
203
  else:
 
208
 
209
  @app.get("/")
210
  async def root():
211
+ return {"message": "Server attivo e pronto a generare query SPARQL!"}