Spaces:

GABRIELSZK
/

EXAMES

Sleeping

App Files Files Community

GABRIELSZK commited on May 13

Commit

9afb7d7

verified ·

1 Parent(s): f3bf590

Update app.py

Browse files

Files changed (1) hide show

app.py +44 -60

app.py CHANGED Viewed

@@ -7,7 +7,7 @@ import pytesseract
 from PIL import Image, ImageEnhance, ImageFilter
 import io
-# 🎯 Faixas de referência (valores de referência mínimos e máximos)
 faixas = {
     "LEUCO": (4000, 11000),
     "B": (0, 1), "SS": (45, 59), "EOS": (1, 6), "LINF": (30, 50), "MONO": (1, 8),
@@ -41,79 +41,63 @@ def classificar(nome, valor):
     except:
         return valor
-# Ajustes para melhorar OCR
 def melhorar_imagem(img: Image.Image) -> Image.Image:
     img = img.convert("L")
     img = ImageEnhance.Contrast(img).enhance(2)
     return img.filter(ImageFilter.SHARPEN)
-# Extrai texto nativo + OCR
 def extrair_texto_pdf(pdf_input):
-    if isinstance(pdf_input, dict):
-        pdf_path = pdf_input.get("name") or pdf_input.get("file_path")
-    elif hasattr(pdf_input, "name") and isinstance(pdf_input.name, str):
-        pdf_path = pdf_input.name
-    else:
-        pdf_path = str(pdf_input)
-    texto_nativo, ocr_imgs = [], []
-    with fitz.open(pdf_path) as doc:
-        for page in doc:
-            texto_nativo.append(page.get_text())
-            pix = page.get_pixmap(dpi=300)
-            img = Image.open(io.BytesIO(pix.tobytes("png")))
-            ocr_imgs.append(melhorar_imagem(img))
-    tn = re.sub(r"\s+", " ", "".join(texto_nativo))
-    tocr = re.sub(r"\s+", " ", " ".join(pytesseract.image_to_string(im) for im in ocr_imgs))
-    return tn, tocr
-# Padrões de extração incluindo EAS completo
 exames = {
     # Hemograma
-    "LEUCO": r"leuc[óo]citos.*?([\d.,]+)\s*/u?l",
-    "B":    r"bas[óo]filos.*?([\d.,]+)\s?%",
-    "SS":   r"segmentados.*?([\d.,]+)\s?%",
-    "EOS":  r"eosin[óo]filos.*?([\d.,]+)\s?%",
-    "LINF": r"linf[oó]citos.*?([\d.,]+)\s?%",
-    "MONO": r"mon[óo]citos.*?([\d.,]+)\s?%",
-    "HB":   r"hemoglobina.*?([\d.,]+)\s?g/dl",
-    "HT":   r"hemat[óo]crito.*?([\d.,]+)\s?%",
-    "PLT":  r"plaquetas.*?([\d.,]+).*?/u?l",
     # Bioquímica
-    "AMIL": r"amilase.*?resultado[:\s]*([\d.,]+)\s?u/l",
-    "BT":   r"bilirrubina total.*?([\d.,]+)\s?mg/dl",
-    "BD":   r"bilirrubina direta.*?([\d.,]+)\s?mg/dl",
-    "BI":   r"bilirrubina indireta.*?([\d.,]+)\s?mg/dl",
-    "CR":   r"creatinina.*?resultado[:\s]*([\d.,]+)\s?mg/dl",
-    "UREIA":r"ureia.*?resultado[:\s]*([\d.,]+)\s?mg/dl",
-    "FAL":  r"fosfatase alcalina.*?resultado[:\s]*([\d.,]+)\s?u/l",
-    "GGT":  r"ggt.*?resultado[:\s]*([\d.,]+)\s?u/l",
-    "TGO":  r"tgo.*?resultado[:\s]*([\d.,]+)\s?u/l",
-    "TGP":  r"tgp.*?resultado[:\s]*([\d.,]+)\s?u/l",
-    "GLI":  r"glicose(?! qualitativa).*?resultado[:\s]*([\d.,]+)\s?mg/dl",
-    "LIP":  r"lipase.*?resultado[:\s]*([\d.,]+)\s?u/l",
-    "MG++": r"magn[eé]sio.*?resultado[:\s]*([\d.,]+)\s?mg/dl",
     # Coagulação
-    "TAP":      r"tempo de protrombina.*?resultado[:\s]*([\d.,]+)",
-    "INR":      r"inr.*?([\d.,]+)",
-    "TTP":      r"ttpa.*?resultado[:\s]*([\d.,]+)",
-    "DIMERO D": r"d[ií]mero d.*?resultado[:\s]*([\d.,]+)",
     # Inflamatório e Cardíacos
-    "PCR":        r"pcr.*?resultado[:\s]*([\d.,]+)",
-    "CKMB":       r"ck[- ]?mb.*?resultado[:\s]*([\d.,]+)",
-    "CPK":        r"cpk.*?resultado[:\s]*([\d.,]+)",
-    "TROPONINA":  r"troponina(?! qualitativa).*?resultado[:\s]*([>\d.,]+)",
     "TROPONINA QUAL": r"troponina qualitativa.*?resultado[:\s]*(positivo|negativo)",
     # EAS completo (Urina)
-    "PROTEINA UR":    r"prote[ií]na\s*(ausente|positivo|negativo)",
-    "GLI UR":         r"glicose\s*(ausente|positivo|negativo)",
-    "CETONAS UR":     r"corpos cet[oô]nicos.*?(ausente|positivo|negativo)",
-    "SANGUE UR":      r"sangue\s*(ausente|positivo|negativo)",
-    "LEUC ESTERASE":  r"leuc[óo]citos? esterase\s*[:\-]?\s*(ausente|positivo|negativo)",
-    "NITRITO UR":     r"nitrito\s*(ausente|positivo|negativo)",
-    "LEUCO EAS":      r"leuc[óo]citos?\s*([\d]+[-\/–][\d]+)",
-    "HEMA EAS":       r"hem[áa]cias?\s*([\d]+[-\/–][\d]+)",
-    "BACTERIAS UR":   r"bact[ée]rias?\s*(raras|ausentes|positivas|negativas)"
 }
 ordem = [

 from PIL import Image, ImageEnhance, ImageFilter
 import io
+# 🎯 Faixas de referência
 faixas = {
     "LEUCO": (4000, 11000),
     "B": (0, 1), "SS": (45, 59), "EOS": (1, 6), "LINF": (30, 50), "MONO": (1, 8),
     except:
         return valor
 def melhorar_imagem(img: Image.Image) -> Image.Image:
     img = img.convert("L")
     img = ImageEnhance.Contrast(img).enhance(2)
     return img.filter(ImageFilter.SHARPEN)
 def extrair_texto_pdf(pdf_input):
+    # ... (mesma função de antes)
+    # retorna texto nativo e OCR como uma única linha, com espaços
+    ...
+# Padrões de extração — agora com word‐boundaries e unidades obrigatórias
 exames = {
     # Hemograma
+    "LEUCO": r"\bleuc[óo]citos\b.*?([\d.,]+)\s*/u?l",
+    "B":    r"\bbastonetes\b.*?([\d.,]+)\s?%",
+    "SS":   r"\bsegmentados\b.*?([\d.,]+)\s?%",
+    "EOS":  r"\beosin[óo]filos\b.*?([\d.,]+)\s?%",
+    "LINF": r"\blinf[oó]citos\b.*?([\d.,]+)\s?%",
+    "MONO": r"\bmon[óo]citos\b.*?([\d.,]+)\s?%",
+    "HB":   r"\bhemoglobina\b.*?([\d.,]+)\s?g/dl",
+    "HT":   r"\bhemat[óo]crito\b.*?([\d.,]+)\s?%",
+    "PLT":  r"\bplaquetas\b.*?([\d.,]+)\s*/u?l",
     # Bioquímica
+    "AMIL": r"\bamilase\b.*?resultado[:\s]*([\d.,]+)\s?u/l",
+    "BT":   r"\bbilirrubina total\b.*?([\d.,]+)\s?mg/dl",
+    "BD":   r"\bbilirrubina direta\b.*?([\d.,]+)\s?mg/dl",
+    "BI":   r"\bbilirrubina indireta\b.*?([\d.,]+)\s?mg/dl",
+    "CR":   r"\bcreatinina\b.*?resultado[:\s]*([\d.,]+)\s?mg/dl",
+    "UREIA":r"\bureia\b.*?resultado[:\s]*([\d.,]+)\s?mg/dl",
+    "FAL":  r"\bfosfatase alcalina\b.*?resultado[:\s]*([\d.,]+)\s?u/l",
+    "GGT":  r"\bggt\b.*?resultado[:\s]*([\d.,]+)\s?u/l",
+    "TGO":  r"\btgo\b.*?resultado[:\s]*([\d.,]+)\s?u/l",
+    "TGP":  r"\btgp\b.*?resultado[:\s]*([\d.,]+)\s?u/l",
+    "GLI":  r"\bglicose\b(?! qualitativa).*?resultado[:\s]*([\d.,]+)\s?mg/dl",
+    "LIP":  r"\blipase\b.*?resultado[:\s]*([\d.,]+)\s?u/l",
+    "MG++": r"\bmagn[eé]sio\b.*?resultado[:\s]*([\d.,]+)\s?mg/dl",
     # Coagulação
+    "TAP":      r"\btempo de protrombina\b.*?resultado[:\s]*([\d.,]+)",
+    "INR":      r"\binr\b.*?([\d.,]+)",
+    "TTP":      r"\bttpa\b.*?resultado[:\s]*([\d.,]+)",
+    "DIMERO D": r"\bd[ií]mero d\b.*?resultado[:\s]*([\d.,]+)",
     # Inflamatório e Cardíacos
+    "PCR":       r"\bpcr\b.*?resultado[:\s]*([\d.,]+)\s?mg/dl",
+    "CKMB":      r"\bck[- ]?mb\b.*?resultado[:\s]*([\d.,]+)\s?u/l",
+    "CPK":       r"\bcpk\b.*?resultado[:\s]*([\d.,]+)\s?u/l",
+    "TROPONINA": r"troponina(?! qualitativa).*?resultado[:\s]*([><\d.,]+)(?=\s*ng\/?m[lL])",
     "TROPONINA QUAL": r"troponina qualitativa.*?resultado[:\s]*(positivo|negativo)",
     # EAS completo (Urina)
+    "PROTEINA UR":    r"\bprote[ií]na\b.*?\b(ausente|positivo|negativo)",
+    "GLI UR":         r"\bglicose\b.*?\b(ausente|positivo|negativo)",
+    "CETONAS UR":     r"\bcorpos cet[oô]nicos\b.*?\b(ausente|positivo|negativo)",
+    "SANGUE UR":      r"\bsangue\b.*?\b(ausente|positivo|negativo)",
+    "LEUC ESTERASE":  r"\bleuc[óo]citos? esterase\b.*?\b(ausente|positivo|negativo)",
+    "NITRITO UR":     r"\bnitrito\b.*?\b(ausente|positivo|negativo)",
+    "LEUCO EAS":      r"\bleuc[óo]citos?\b\s*([\d]+[-\/–][\d]+)",
+    "HEMA EAS":       r"\bhem[áa]cias?\b\s*([\d]+[-\/–][\d]+)",
+    "BACTERIAS UR":   r"\bbact[ée]rias?\b.*?\b(raras|ausentes|positivas|negativas)"
 }
 ordem = [