Spaces:
Sleeping
Sleeping
Upload 3 files
Browse files
app.py
CHANGED
@@ -32,13 +32,13 @@ def classificar(nome, valor):
|
|
32 |
return valor
|
33 |
|
34 |
def melhorar_imagem(img):
|
35 |
-
img = img.convert('L')
|
36 |
img = ImageEnhance.Contrast(img).enhance(2)
|
37 |
img = img.filter(ImageFilter.SHARPEN)
|
38 |
return img
|
39 |
|
40 |
def limpar_texto(texto):
|
41 |
-
texto = re.sub(r'([A-Z])\s+([A-Z])', r'\1\2', texto)
|
42 |
return re.sub(r'\s+', ' ', texto)
|
43 |
|
44 |
def extrair_texto_pdf(pdf_file):
|
@@ -66,24 +66,24 @@ def extrair_exames_formatado(pdf_file):
|
|
66 |
return "Nenhum arquivo enviado.", None
|
67 |
|
68 |
texto_fitz, texto_ocr = extrair_texto_pdf(pdf_file)
|
69 |
-
textos = [texto_fitz, texto_ocr]
|
70 |
|
71 |
exames = {
|
72 |
-
"AMIL": r"amilase
|
73 |
-
"ÁC UR": r"ácido
|
74 |
-
"BT": r"
|
75 |
-
"BD": r"
|
76 |
-
"BI": r"
|
77 |
-
"CAI": r"
|
78 |
-
"CA TOTAL": r"
|
79 |
"CL-": r"cloro[^\d]{0,10}([\d.,]+)",
|
80 |
"CR": r"creatinina[^\d]{0,10}([\d.,]+)",
|
81 |
-
"FAL": r"
|
82 |
-
"FÓS": r"
|
83 |
-
"GGT": r"
|
84 |
"GLI": r"glicose[^\d]{0,10}([\d.,]+)",
|
85 |
"LIP": r"lipase[^\d]{0,10}([\d.,]+)",
|
86 |
-
"MG++": r"
|
87 |
"PCR": r"pcr[^\d]{0,10}([\d.,]+)",
|
88 |
"K+": r"pot[áa]ssio[^\d]{0,10}([\d.,]+)",
|
89 |
"PTN": r"proteínas totais[^\d]{0,10}([\d.,]+)",
|
|
|
32 |
return valor
|
33 |
|
34 |
def melhorar_imagem(img):
|
35 |
+
img = img.convert('L')
|
36 |
img = ImageEnhance.Contrast(img).enhance(2)
|
37 |
img = img.filter(ImageFilter.SHARPEN)
|
38 |
return img
|
39 |
|
40 |
def limpar_texto(texto):
|
41 |
+
texto = re.sub(r'\b([A-Z])\s+([A-Z])\b', r'\1\2', texto) # Junta siglas com espaços (ex: "C P K" → "CPK")
|
42 |
return re.sub(r'\s+', ' ', texto)
|
43 |
|
44 |
def extrair_texto_pdf(pdf_file):
|
|
|
66 |
return "Nenhum arquivo enviado.", None
|
67 |
|
68 |
texto_fitz, texto_ocr = extrair_texto_pdf(pdf_file)
|
69 |
+
textos = [texto_fitz, texto_ocr] # Sempre considerar ambos
|
70 |
|
71 |
exames = {
|
72 |
+
"AMIL": r"amilase[^\d]{0,10}([\d.,]+)",
|
73 |
+
"ÁC UR": r"ácido[\s]?úrico[^\d]{0,10}([\d.,]+)",
|
74 |
+
"BT": r"bilirrubina total|bt[^\d]{0,10}([\d.,]+)",
|
75 |
+
"BD": r"bilirrubina direta|bd[^\d]{0,10}([\d.,]+)",
|
76 |
+
"BI": r"bilirrubina indireta|bi[^\d]{0,10}([\d.,]+)",
|
77 |
+
"CAI": r"cálcio ionizável|cai[^\d]{0,10}([\d.,]+)",
|
78 |
+
"CA TOTAL": r"cálcio total[^\d]{0,10}([\d.,]+)",
|
79 |
"CL-": r"cloro[^\d]{0,10}([\d.,]+)",
|
80 |
"CR": r"creatinina[^\d]{0,10}([\d.,]+)",
|
81 |
+
"FAL": r"fosfatase alcalina|fal[^\d]{0,10}([\d.,]+)",
|
82 |
+
"FÓS": r"f[óo]sforo[^\d]{0,10}([\d.,]+)",
|
83 |
+
"GGT": r"gama.*?gt|ggt[^\d]{0,10}([\d.,]+)",
|
84 |
"GLI": r"glicose[^\d]{0,10}([\d.,]+)",
|
85 |
"LIP": r"lipase[^\d]{0,10}([\d.,]+)",
|
86 |
+
"MG++": r"magn[ée]sio[^\d]{0,10}([\d.,]+)",
|
87 |
"PCR": r"pcr[^\d]{0,10}([\d.,]+)",
|
88 |
"K+": r"pot[áa]ssio[^\d]{0,10}([\d.,]+)",
|
89 |
"PTN": r"proteínas totais[^\d]{0,10}([\d.,]+)",
|