Spaces:

GABRIELSZK
/

EXAMES

Sleeping

App Files Files Community

GABRIELSZK commited on Apr 25

Commit

4a45397

verified ·

1 Parent(s): d094d4f

Upload 2 files

Browse files

Files changed (2) hide show

app.py +1 -136
requirements.txt +4 -1

app.py CHANGED Viewed

@@ -1,136 +1 @@
-import fitz
-import re
-import gradio as gr
-import pandas as pd
-import tempfile
-# Faixas de referência básicas para classificação (valores em mg/dL, g/dL, etc.)
-faixas = {
-    "HB": (12, 17),
-    "HT": (36, 50),
-    "GLI": (70, 99),
-    "UREIA": (10, 50),
-    "CR": (0.6, 1.3),
-    "K+": (3.5, 5.5),
-    "NA+": (135, 145),
-    "TGO": (0, 40),
-    "TGP": (0, 40),
-    "ALB": (3.5, 5.0),
-    "INR": (0.8, 1.2),
-    "TAP": (10, 14),
-    "TTP": (25, 35),
-    "LAC": (0.5, 2.2),
-    "PLT": (150000, 450000),
-    "LEUCO": (4000, 11000)
-}
-def classificar(nome, valor):
-    try:
-        val = float(valor.replace("K", "000").replace(">", "").replace("<", "").strip())
-        if nome in faixas:
-            min_v, max_v = faixas[nome]
-            if val < min_v:
-                return f"{valor} ↓"
-            elif val > max_v:
-                return f"{valor} ↑"
-        return valor
-    except:
-        return valor
-def extrair_exames_formatado(pdf_file):
-    if pdf_file is None:
-        return "Nenhum arquivo enviado.", None
-    texto = ""
-    with fitz.open(pdf_file.name) as doc:
-        for page in doc:
-            texto += page.get_text()
-    texto = texto.replace('\n', ' ').replace('\r', ' ')
-    def buscar(padrao, excluir_protocolo=True):
-        matches = re.findall(padrao, texto, re.IGNORECASE)
-        for match in matches:
-            val = match.strip().replace(",", ".")
-            if excluir_protocolo and len(val.replace(".", "").replace(">", "").replace("<", "")) > 5:
-                continue  # ignora IDs longos como 2500267046
-            return val
-        return None
-    def k_format(v):
-        try:
-            n = float(v)
-            return f"{round(n / 1000, 1)}K" if n >= 1000 else str(n)
-        except:
-            return v
-    leuco = buscar(r"leuc[óo]citos[^:\d]{0,10}[:=]?\s*(\d{3,5})")
-    bastonetes = buscar(r"bastonetes[^:\d]{0,10}[:=]?\s*(\d+)\s*%")
-    segmentados = buscar(r"segmentados[^:\d]{0,10}[:=]?\s*(\d+)\s*%")
-    leuco_str = ""
-    if leuco:
-        leuco_str = f"LEUCO {k_format(leuco)}"
-        if bastonetes:
-            leuco_str += f" + {bastonetes}% B"
-        if segmentados:
-            leuco_str += f" + {segmentados}% SS"
-    campos = {
-        "UREIA": r"ureia[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "CR": r"creatinina[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "K+": r"(?:pot[áa]ssio|k\+)[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "NA+": r"(?:s[óo]dio|na\+)[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "CL-": r"(?:cl[óo]ro)[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "CAI": r"ioniz[áa]vel[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "CA TOTAL": r"c[áa]lcio total[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "MG++": r"magn[ée]sio[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "FÓS": r"f[óo]sforo[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "GLI": r"glicose[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "HB": r"hemoglobina[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "HT": r"hemat[óo]crito[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "PLT": r"plaquetas[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "INR": r"INR[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "TAP": r"\bTP[^:\d]{0,10}[:=]?\s*([\d.,]+)\s*seg",
-        "TTP": r"TTPA[^:\d]{0,10}[:=]?\s*([\d.,]+)\s*seg",
-        "RELAÇÃO": r"relaç[aã]o.*?(?:paciente|a\/g)[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "LAC": r"lactato[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "TGO": r"\bTGO[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "TGP": r"\bTGP[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "ALB": r"albumina[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "PCR": r"PCR[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "CPK": r"creatinofosfoquinase.*?[:=]?\s*([\d.,]+)",
-        "CKMB": r"CKMB(?:\s*massa)?[^:\d]{0,10}[:=]?\s*([\d.,]+)",
-        "TROPO": r"troponina.*?[:=]?\s*([<>]?\s*[\d.,]+)",
-    }
-    resultados = []
-    if leuco_str:
-        resultados.append(("LEUCO", leuco_str))
-    for rotulo, padrao in campos.items():
-        val = buscar(padrao)
-        if val:
-            val = classificar(rotulo, val)
-            resultados.append((rotulo, val))
-        else:
-            resultados.append((rotulo, "—"))
-    df = pd.DataFrame(resultados, columns=["Exame", "Valor"])
-    texto_final = "\n".join([f"{r[0]}: {r[1]}" for r in resultados])
-    # Exportação CSV temporária
-    temp_file = tempfile.NamedTemporaryFile(delete=False, suffix=".csv")
-    df.to_csv(temp_file.name, index=False)
-    return texto_final, temp_file.name
-with gr.Blocks() as demo:
-    gr.Markdown("## 🧪 Extrator Inteligente de Exames Laboratoriais - PDF para Diagnóstico")
-    pdf_file = gr.File(label="📄 PDF de exames", file_types=[".pdf"])
-    extract_button = gr.Button("🔍 Extrair Exames")
-    output_text = gr.Textbox(label="📋 Exames extraídos e classificados", lines=25)
-    download_button = gr.File(label="📥 Baixar CSV")
-    extract_button.click(fn=extrair_exames_formatado, inputs=pdf_file, outputs=[output_text, download_button])
-demo.launch()


1	+ <CÓDIGO FINAL COM OCR INSERIDO AQUI (reduzido para visualização)>

requirements.txt CHANGED Viewed

@@ -1,2 +1,5 @@
 gradio>=5.26.0
-PyMuPDF

 gradio>=5.26.0
+pymupdf
+pytesseract
+pillow
+pandas