Spaces:

GABRIELSZK
/

EXAMES

Sleeping

App Files Files Community

GABRIELSZK commited on Apr 26

Commit

b5da647

verified ·

1 Parent(s): 0f3685a

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -16

app.py CHANGED Viewed

@@ -1,4 +1,4 @@
-# Código completo atualizado com extração de EAS incluída no Gradio
 import fitz
 import re
@@ -87,8 +87,7 @@ exames = {
     "MG++":    r"magn[eé]sio.*?([\d.,]+)\s?mg/dl",
     "PCR":     r"pcr.*?\bresultado\b\s*([\d]+,[\d]+)",
     "K+":      r"pot[áa]ssio.*?([\d.,]+)\s?mmol/l",
-    "NA+":     r"s[óo]dio.*?([\d.,]+)\s?mmol/l",
-    "PTN":     r"prote[íi]na total.*?([\d.,]+)\s?g/dl",
     "ALB":     r"albumina.*?([\d.,]+)\s?g/dl",
     "GLOB":    r"globulina.*?([\d.,]+)\s?g/dl",
     "RELAÇÃO": r"rela[cç][ãa]o\s+a\/g.*?([\d.,]+)",
@@ -133,28 +132,36 @@ def extrair_exames_formatado(pdf_file):
             if m:
                 val = m.group(1).replace(',', '.')
                 break
-        resultados[rotulo] = classificar(rotulo, val) if val else "—"
-    # Monta a parte principal
-    partes = [f"{r}: {resultados[r]}" for r in ordem]
-    texto_main = " / ".join(partes)
-    # Monta o segmento de EAS, se presente
     eas_chaves = ["LEUC ESTERASE","LEUCO EAS","HEMA EAS","BACTERIAS"]
-    eas_partes = [f"{k}: {resultados[k]}" for k in eas_chaves if resultados[k] != "—"]
-    if eas_partes:
-        texto_main = "EAS: " + " / ".join(eas_partes) + " / " + texto_main
-    # Gera CSV
-    df = pd.DataFrame(list(resultados.items()), columns=["Exame","Valor"])
     temp = tempfile.NamedTemporaryFile(delete=False, suffix=".csv")
     df.to_csv(temp.name, index=False)
-    return texto_main, temp.name
 # Interface Gradio
 with gr.Blocks() as demo:
-    gr.Markdown("## 🧪 Extrator Avançado com OCR e EAS")
     pdf_file = gr.File(label="📄 PDF de exames", file_types=[".pdf"])
     btn = gr.Button("🔍 Extrair Exames")
     out_txt = gr.Textbox(label="📋 Exames Classificados", lines=12)

+# Código completo atualizado para omitir exames ausentes no PDF
 import fitz
 import re
     "MG++":    r"magn[eé]sio.*?([\d.,]+)\s?mg/dl",
     "PCR":     r"pcr.*?\bresultado\b\s*([\d]+,[\d]+)",
     "K+":      r"pot[áa]ssio.*?([\d.,]+)\s?mmol/l",
+    "NA+":     r"s[óo]dio.*?([\d.,]+)\s?mmol/l",    "PTN":     r"prote[íi]na total.*?([\d.,]+)\s?g/dl",
     "ALB":     r"albumina.*?([\d.,]+)\s?g/dl",
     "GLOB":    r"globulina.*?([\d.,]+)\s?g/dl",
     "RELAÇÃO": r"rela[cç][ãa]o\s+a\/g.*?([\d.,]+)",
             if m:
                 val = m.group(1).replace(',', '.')
                 break
+        if val:
+            resultados[rotulo] = classificar(rotulo, val)
+    # EAS (se presente)
     eas_chaves = ["LEUC ESTERASE","LEUCO EAS","HEMA EAS","BACTERIAS"]
+    partes_eas = [f"{k}: {resultados[k]}" for k in eas_chaves if k in resultados]
+    texto_eas = ""
+    if partes_eas:
+        texto_eas = "EAS: " + " / ".join(partes_eas)
+    # Parte principal (omite ausentes)
+    partes_main = [f"{r}: {resultados[r]}" for r in ordem if r in resultados]
+    texto_main = " / ".join(partes_main)
+    # Concatena
+    texto_final = " / ".join([t for t in (texto_eas, texto_main) if t])
+    # Gera CSV apenas com presentes
+    df = pd.DataFrame(
+        [(k, resultados[k]) for k in resultados],
+        columns=["Exame","Valor"]
+    )
     temp = tempfile.NamedTemporaryFile(delete=False, suffix=".csv")
     df.to_csv(temp.name, index=False)
+    return texto_final, temp.name
 # Interface Gradio
 with gr.Blocks() as demo:
+    gr.Markdown("## 🧪 Extrator Avançado com OCR e EAS (sem ausentes)")
     pdf_file = gr.File(label="📄 PDF de exames", file_types=[".pdf"])
     btn = gr.Button("🔍 Extrair Exames")
     out_txt = gr.Textbox(label="📋 Exames Classificados", lines=12)