Spaces:

GABRIELSZK
/

EXAMES

Sleeping

App Files Files Community

GABRIELSZK commited on Apr 26

Commit

0f3685a

verified ·

1 Parent(s): d354e3f

Update app.py

Browse files

Files changed (1) hide show

app.py +25 -8

app.py CHANGED Viewed

@@ -1,3 +1,5 @@
 import fitz
 import re
 import gradio as gr
@@ -56,7 +58,7 @@ def extrair_texto_pdf(pdf_file):
     texto_ocr = re.sub(r'\s+', ' ', texto_ocr)
     return texto_fitz, texto_ocr
-# Padrões regex para extração de cada exame
 exames = {
     "LEUCO":   r"leuc[óo]citos.*?([\d.,]+)\s?(?:10\^3)?/u?l",
     "B":       r"bas[óo]filos.*?([\d.,]+)\s?%",
@@ -99,10 +101,15 @@ exames = {
     "LAC":     r"lactato.*?([\d.,]+)\s?mmol/l",
     "CKMB":    r"ck[- ]?mb.*?([\d.,]+)\s?u/l",
     "CPK":     r"cpk.*?\bresultado\b\s*([\d.,]+)",
-    "TROPO":   r"troponina.*?([<>]?[\d.,]+)\s?ng/ml"
 }
-# Ordem de saída conforme especificado
 ordem = [
     "LEUCO","B","SS","EOS","LINF","MONO",
     "HB","HT","PLT","AMIL","ÁC UR","BT","BD","BI",
@@ -113,7 +120,6 @@ ordem = [
     "CKMB","CPK","TROPO"
 ]
-# Função principal de extração e formatação
 def extrair_exames_formatado(pdf_file):
     if not pdf_file:
         return "Nenhum arquivo enviado.", None
@@ -128,16 +134,27 @@ def extrair_exames_formatado(pdf_file):
                 val = m.group(1).replace(',', '.')
                 break
         resultados[rotulo] = classificar(rotulo, val) if val else "—"
-    partes = [f"{r} {resultados[r]}" for r in ordem]
-    texto_final = " / ".join(partes)
     df = pd.DataFrame(list(resultados.items()), columns=["Exame","Valor"])
     temp = tempfile.NamedTemporaryFile(delete=False, suffix=".csv")
     df.to_csv(temp.name, index=False)
-    return texto_final, temp.name
 # Interface Gradio
 with gr.Blocks() as demo:
-    gr.Markdown("## 🧪 Extrator Avançado com OCR - Versão Corrigida com D-Dímero")
     pdf_file = gr.File(label="📄 PDF de exames", file_types=[".pdf"])
     btn = gr.Button("🔍 Extrair Exames")
     out_txt = gr.Textbox(label="📋 Exames Classificados", lines=12)

+# Código completo atualizado com extração de EAS incluída no Gradio
 import fitz
 import re
 import gradio as gr
     texto_ocr = re.sub(r'\s+', ' ', texto_ocr)
     return texto_fitz, texto_ocr
+# Padrões regex para extração de cada exame, incluindo EAS
 exames = {
     "LEUCO":   r"leuc[óo]citos.*?([\d.,]+)\s?(?:10\^3)?/u?l",
     "B":       r"bas[óo]filos.*?([\d.,]+)\s?%",
     "LAC":     r"lactato.*?([\d.,]+)\s?mmol/l",
     "CKMB":    r"ck[- ]?mb.*?([\d.,]+)\s?u/l",
     "CPK":     r"cpk.*?\bresultado\b\s*([\d.,]+)",
+    "TROPO":   r"troponina.*?([<>]?[\d.,]+)\s?ng/ml",
+    # Padrões para EAS
+    "LEUC ESTERASE": r"Leuc[óo]cito esterase\s*[:\-]?\s*([A-Za-z0-9\+\-]+)",
+    "LEUCO EAS":     r"Leuc[óo]citos?\s*[:\-]?\s*([\d]+\/\d+)",
+    "HEMA EAS":      r"Hem[áa]cias?\s*[:\-]?\s*([\d]+\/\d+)",
+    "BACTERIAS":     r"Bact[ée]rias?\s*[:\-]?\s*([A-Za-z]+)"
 }
+# Ordem de saída das chaves (sem EAS)
 ordem = [
     "LEUCO","B","SS","EOS","LINF","MONO",
     "HB","HT","PLT","AMIL","ÁC UR","BT","BD","BI",
     "CKMB","CPK","TROPO"
 ]
 def extrair_exames_formatado(pdf_file):
     if not pdf_file:
         return "Nenhum arquivo enviado.", None
                 val = m.group(1).replace(',', '.')
                 break
         resultados[rotulo] = classificar(rotulo, val) if val else "—"
+    # Monta a parte principal
+    partes = [f"{r}: {resultados[r]}" for r in ordem]
+    texto_main = " / ".join(partes)
+    # Monta o segmento de EAS, se presente
+    eas_chaves = ["LEUC ESTERASE","LEUCO EAS","HEMA EAS","BACTERIAS"]
+    eas_partes = [f"{k}: {resultados[k]}" for k in eas_chaves if resultados[k] != "—"]
+    if eas_partes:
+        texto_main = "EAS: " + " / ".join(eas_partes) + " / " + texto_main
+    # Gera CSV
     df = pd.DataFrame(list(resultados.items()), columns=["Exame","Valor"])
     temp = tempfile.NamedTemporaryFile(delete=False, suffix=".csv")
     df.to_csv(temp.name, index=False)
+    return texto_main, temp.name
 # Interface Gradio
 with gr.Blocks() as demo:
+    gr.Markdown("## 🧪 Extrator Avançado com OCR e EAS")
     pdf_file = gr.File(label="📄 PDF de exames", file_types=[".pdf"])
     btn = gr.Button("🔍 Extrair Exames")
     out_txt = gr.Textbox(label="📋 Exames Classificados", lines=12)