Spaces:

histlearn
/

BoletimSed

Sleeping

App Files Files Community

histlearn commited on Oct 28, 2024

Commit

7df5762

verified ·

1 Parent(s): cf44738

Update app.py

Browse files

Files changed (1) hide show

app.py +93 -38

app.py CHANGED Viewed

@@ -86,11 +86,13 @@ def temp_file(suffix=None):
             os.unlink(temp.name)
 class PDFReport(FPDF):
     def __init__(self):
         super().__init__()
         self.set_auto_page_break(auto=True, margin=15)
     def header_footer(self):
         self.set_y(-30)
         self.line(10, self.get_y(), 200, self.get_y())
         self.ln(5)
@@ -99,9 +101,52 @@ class PDFReport(FPDF):
                  'Este relatório é uma análise automática e deve ser validado junto à secretaria da escola.',
                  0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='C')
-# Função de extração de tabelas do PDF
 def extrair_tabelas_pdf(pdf_path: str) -> pd.DataFrame:
     try:
         tables_header = camelot.read_pdf(
             pdf_path,
             pages='1',
@@ -110,6 +155,8 @@ def extrair_tabelas_pdf(pdf_path: str) -> pd.DataFrame:
         )
         info_aluno = {}
         for table in tables_header:
             df = table.df
             for i in range(len(df)):
@@ -127,12 +174,14 @@ def extrair_tabelas_pdf(pdf_path: str) -> pd.DataFrame:
                         except:
                             continue
         tables_notas = camelot.read_pdf(
             pdf_path,
             pages='all',
             flavor='lattice'
         )
         df_notas = None
         max_rows = 0
@@ -153,6 +202,7 @@ def extrair_tabelas_pdf(pdf_path: str) -> pd.DataFrame:
         if df_notas is None:
             raise ValueError("Tabela de notas não encontrada")
         df_notas.attrs['nome'] = info_aluno.get('nome', 'Nome não encontrado')
         return df_notas
@@ -161,8 +211,14 @@ def extrair_tabelas_pdf(pdf_path: str) -> pd.DataFrame:
         logger.error(f"Erro na extração das tabelas: {str(e)}")
         raise
-# Função para identificar disciplinas válidas
 def obter_disciplinas_validas(df: pd.DataFrame) -> List[Dict]:
     colunas_notas = ['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']
     colunas_freq = ['%Freq B1', '%Freq B2', '%Freq B3', '%Freq B4']
@@ -204,48 +260,47 @@ def obter_disciplinas_validas(df: pd.DataFrame) -> List[Dict]:
     return disciplinas_dados
-# Função de conversão de nota
-def converter_nota(valor) -> Optional[float]:
-    if pd.isna(valor) or valor == '-' or valor == 'N' or valor == '' or valor == 'None':
-        return None
-    if isinstance(valor, str):
-        valor_limpo = valor.strip().upper()
-        if valor_limpo in CONCEITOS_VALIDOS:
-            conceitos_map = {'ET': 10, 'ES': 8, 'EP': 6}
-            return conceitos_map.get(valor_limpo)
-        try:
-            return float(valor_limpo.replace(',', '.'))
-        except:
-            return None
-    if isinstance(valor, (int, float)):
-        return float(valor)
-    return None
-# Funções de cálculo de médias e frequências
-def calcular_media_bimestres(notas: List[float]) -> float:
-    notas_validas = [nota for nota in notas if nota is not None]
-    return sum(notas_validas) / len(notas_validas) if notas_validas else 0
-def calcular_frequencia_media(frequencias: List[str]) -> float:
-    freq_validas = []
-    for freq in frequencias:
-        try:
-            if isinstance(freq, str):
-                freq = freq.strip().replace('%', '').replace(',', '.')
-            if freq and freq != '-':
-                valor = float(freq)
-                if valor > 0:
-                    freq_validas.append(valor)
-        except:
-            continue
-    return sum(freq_validas) / len(freq_validas) if freq_validas else 0
-# Funções de plotagem
 def plotar_evolucao_bimestres(disciplinas_dados: List[Dict], temp_dir: str,
                              titulo: Optional[str] = None,
                              nome_arquivo: Optional[str] = None) -> str:

             os.unlink(temp.name)
 class PDFReport(FPDF):
+    """Classe personalizada para geração do relatório PDF."""
     def __init__(self):
         super().__init__()
         self.set_auto_page_break(auto=True, margin=15)
     def header_footer(self):
+        """Adiciona header e footer padrão nas páginas."""
         self.set_y(-30)
         self.line(10, self.get_y(), 200, self.get_y())
         self.ln(5)
                  'Este relatório é uma análise automática e deve ser validado junto à secretaria da escola.',
                  0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='C')
+def converter_nota(valor) -> Optional[float]:
+    """Converte valor de nota para float, tratando casos especiais e conceitos."""
+    if pd.isna(valor) or valor == '-' or valor == 'N' or valor == '' or valor == 'None':
+        return None
+    if isinstance(valor, str):
+        valor_limpo = valor.strip().upper()
+        if valor_limpo in CONCEITOS_VALIDOS:
+            conceitos_map = {'ET': 10, 'ES': 8, 'EP': 6}
+            return conceitos_map.get(valor_limpo)
+        try:
+            return float(valor_limpo.replace(',', '.'))
+        except:
+            return None
+    if isinstance(valor, (int, float)):
+        return float(valor)
+    return None
+def calcular_media_bimestres(notas: List[float]) -> float:
+    """Calcula média considerando apenas bimestres com notas válidas."""
+    notas_validas = [nota for nota in notas if nota is not None]
+    return sum(notas_validas) / len(notas_validas) if notas_validas else 0
+def calcular_frequencia_media(frequencias: List[str]) -> float:
+    """Calcula média de frequência considerando apenas bimestres cursados."""
+    freq_validas = []
+    for freq in frequencias:
+        try:
+            if isinstance(freq, str):
+                freq = freq.strip().replace('%', '').replace(',', '.')
+            if freq and freq != '-':
+                valor = float(freq)
+                if valor > 0:
+                    freq_validas.append(valor)
+        except:
+            continue
+    return sum(freq_validas) / len(freq_validas) if freq_validas else 0
 def extrair_tabelas_pdf(pdf_path: str) -> pd.DataFrame:
+    """Extrai tabelas do PDF usando stream para o nome e lattice para notas."""
     try:
+        # Extrair nome do aluno usando stream
         tables_header = camelot.read_pdf(
             pdf_path,
             pages='1',
         )
         info_aluno = {}
+        # Procurar nome do aluno
         for table in tables_header:
             df = table.df
             for i in range(len(df)):
                         except:
                             continue
+        # Extrair tabela de notas usando lattice
         tables_notas = camelot.read_pdf(
             pdf_path,
             pages='all',
             flavor='lattice'
         )
+        # Encontrar tabela de notas
         df_notas = None
         max_rows = 0
         if df_notas is None:
             raise ValueError("Tabela de notas não encontrada")
+        # Adicionar informações do aluno ao DataFrame
         df_notas.attrs['nome'] = info_aluno.get('nome', 'Nome não encontrado')
         return df_notas
         logger.error(f"Erro na extração das tabelas: {str(e)}")
         raise
+def detectar_nivel_ensino(disciplinas: List[str]) -> str:
+    """Detecta se é ensino fundamental ou médio baseado nas disciplinas."""
+    disciplinas_set = set(disciplinas)
+    disciplinas_exclusivas_medio = {'BIOLOGIA', 'FISICA', 'QUIMICA', 'FILOSOFIA', 'SOCIOLOGIA'}
+    return 'medio' if any(d in disciplinas_set for d in disciplinas_exclusivas_medio) else 'fundamental'
 def obter_disciplinas_validas(df: pd.DataFrame) -> List[Dict]:
+    """Identifica disciplinas válidas no boletim com seus dados."""
     colunas_notas = ['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']
     colunas_freq = ['%Freq B1', '%Freq B2', '%Freq B3', '%Freq B4']
     return disciplinas_dados
+def separar_disciplinas_por_categoria(disciplinas_dados: List[Dict]) -> Dict:
+    """Separa as disciplinas em formação básica e diversificada."""
+    disciplinas = [d['disciplina'] for d in disciplinas_dados]
+    nivel = detectar_nivel_ensino(disciplinas)
+    formacao_basica = []
+    diversificada = []
+    for disc_data in disciplinas_dados:
+        if disc_data['disciplina'] in FORMACAO_BASICA[nivel]:
+            formacao_basica.append(disc_data)
+        else:
+            diversificada.append(disc_data)
+    return {
+        'nivel': nivel,
+        'formacao_basica': formacao_basica,
+        'diversificada': diversificada
+# Funções de plotagem
+def gerar_paleta_cores(n_cores: int) -> List[str]:
+    """Gera uma paleta de cores harmoniosa."""
+    cores_formacao_basica = [
+        '#2E86C1',  # Azul royal
+        '#2ECC71',  # Verde esmeralda
+        '#E74C3C',  # Vermelho coral
+        '#F1C40F',  # Amarelo ouro
+        '#8E44AD',  # Roxo médio
+        '#E67E22',  # Laranja escuro
+        '#16A085',  # Verde-água
+        '#D35400'   # Laranja queimado
+    ]
+    if n_cores <= len(cores_formacao_basica):
+        return cores_formacao_basica[:n_cores]
+    # Gerar cores adicionais se necessário
+    HSV_tuples = [(x/n_cores, 0.8, 0.9) for x in range(n_cores)]
+    return ['#%02x%02x%02x' % tuple(int(x*255) for x in colorsys.hsv_to_rgb(*hsv))
+            for hsv in HSV_tuples]
 def plotar_evolucao_bimestres(disciplinas_dados: List[Dict], temp_dir: str,
                              titulo: Optional[str] = None,
                              nome_arquivo: Optional[str] = None) -> str: