GABRIELSZK commited on
Commit
9293a56
·
verified ·
1 Parent(s): 9d5911a

Upload 3 files

Browse files
Files changed (1) hide show
  1. app.py +14 -14
app.py CHANGED
@@ -32,13 +32,13 @@ def classificar(nome, valor):
32
  return valor
33
 
34
  def melhorar_imagem(img):
35
- img = img.convert('L')
36
  img = ImageEnhance.Contrast(img).enhance(2)
37
  img = img.filter(ImageFilter.SHARPEN)
38
  return img
39
 
40
  def limpar_texto(texto):
41
- texto = re.sub(r'([A-Z])\s+([A-Z])', r'\1\2', texto)
42
  return re.sub(r'\s+', ' ', texto)
43
 
44
  def extrair_texto_pdf(pdf_file):
@@ -66,24 +66,24 @@ def extrair_exames_formatado(pdf_file):
66
  return "Nenhum arquivo enviado.", None
67
 
68
  texto_fitz, texto_ocr = extrair_texto_pdf(pdf_file)
69
- textos = [texto_fitz, texto_ocr]
70
 
71
  exames = {
72
- "AMIL": r"amilase.*?([\d.,]+)",
73
- "ÁC UR": r"ácido úrico.*?([\d.,]+)",
74
- "BT": r"(?:bilirrubina total|bt)[^\d]{0,10}([\d.,]+)",
75
- "BD": r"(?:bilirrubina direta|bd)[^\d]{0,10}([\d.,]+)",
76
- "BI": r"(?:bilirrubina indireta|bi)[^\d]{0,10}([\d.,]+)",
77
- "CAI": r"(?:cálcio ionizável|cai)[^\d]{0,10}([\d.,]+)",
78
- "CA TOTAL": r"(?:cálcio total)[^\d]{0,10}([\d.,]+)",
79
  "CL-": r"cloro[^\d]{0,10}([\d.,]+)",
80
  "CR": r"creatinina[^\d]{0,10}([\d.,]+)",
81
- "FAL": r"(fosfatase alcalina|fal)[^\d]{0,10}([\d.,]+)",
82
- "FÓS": r"fósforo[^\d]{0,10}([\d.,]+)",
83
- "GGT": r"(gama.*?gt|ggt)[^\d]{0,10}([\d.,]+)",
84
  "GLI": r"glicose[^\d]{0,10}([\d.,]+)",
85
  "LIP": r"lipase[^\d]{0,10}([\d.,]+)",
86
- "MG++": r"magnésio[^\d]{0,10}([\d.,]+)",
87
  "PCR": r"pcr[^\d]{0,10}([\d.,]+)",
88
  "K+": r"pot[áa]ssio[^\d]{0,10}([\d.,]+)",
89
  "PTN": r"proteínas totais[^\d]{0,10}([\d.,]+)",
 
32
  return valor
33
 
34
  def melhorar_imagem(img):
35
+ img = img.convert('L')
36
  img = ImageEnhance.Contrast(img).enhance(2)
37
  img = img.filter(ImageFilter.SHARPEN)
38
  return img
39
 
40
  def limpar_texto(texto):
41
+ texto = re.sub(r'\b([A-Z])\s+([A-Z])\b', r'\1\2', texto) # Junta siglas com espaços (ex: "C P K" → "CPK")
42
  return re.sub(r'\s+', ' ', texto)
43
 
44
  def extrair_texto_pdf(pdf_file):
 
66
  return "Nenhum arquivo enviado.", None
67
 
68
  texto_fitz, texto_ocr = extrair_texto_pdf(pdf_file)
69
+ textos = [texto_fitz, texto_ocr] # Sempre considerar ambos
70
 
71
  exames = {
72
+ "AMIL": r"amilase[^\d]{0,10}([\d.,]+)",
73
+ "ÁC UR": r"ácido[\s]?úrico[^\d]{0,10}([\d.,]+)",
74
+ "BT": r"bilirrubina total|bt[^\d]{0,10}([\d.,]+)",
75
+ "BD": r"bilirrubina direta|bd[^\d]{0,10}([\d.,]+)",
76
+ "BI": r"bilirrubina indireta|bi[^\d]{0,10}([\d.,]+)",
77
+ "CAI": r"cálcio ionizável|cai[^\d]{0,10}([\d.,]+)",
78
+ "CA TOTAL": r"cálcio total[^\d]{0,10}([\d.,]+)",
79
  "CL-": r"cloro[^\d]{0,10}([\d.,]+)",
80
  "CR": r"creatinina[^\d]{0,10}([\d.,]+)",
81
+ "FAL": r"fosfatase alcalina|fal[^\d]{0,10}([\d.,]+)",
82
+ "FÓS": r"f[óo]sforo[^\d]{0,10}([\d.,]+)",
83
+ "GGT": r"gama.*?gt|ggt[^\d]{0,10}([\d.,]+)",
84
  "GLI": r"glicose[^\d]{0,10}([\d.,]+)",
85
  "LIP": r"lipase[^\d]{0,10}([\d.,]+)",
86
+ "MG++": r"magn[ée]sio[^\d]{0,10}([\d.,]+)",
87
  "PCR": r"pcr[^\d]{0,10}([\d.,]+)",
88
  "K+": r"pot[áa]ssio[^\d]{0,10}([\d.,]+)",
89
  "PTN": r"proteínas totais[^\d]{0,10}([\d.,]+)",