Spaces:

histlearn
/

BoletimSed

Sleeping

App Files Files Community

histlearn commited on Oct 28, 2024

Commit

59d72a7

verified ·

1 Parent(s): 75c163e

Update app.py

Browse files

Files changed (1) hide show

app.py +84 -7

app.py CHANGED Viewed

@@ -73,9 +73,7 @@ class PDFReport(FPDF):
 # Função de extração de tabelas do PDF
 def extrair_tabelas_pdf(pdf_path: str) -> pd.DataFrame:
-    """Extrai tabelas do PDF usando stream para o nome e lattice para notas."""
     try:
-        # Extrair nome do aluno usando stream
         tables_header = camelot.read_pdf(
             pdf_path,
             pages='1',
@@ -84,8 +82,6 @@ def extrair_tabelas_pdf(pdf_path: str) -> pd.DataFrame:
         )
         info_aluno = {}
-        # Procurar nome do aluno
         for table in tables_header:
             df = table.df
             for i in range(len(df)):
@@ -103,14 +99,12 @@ def extrair_tabelas_pdf(pdf_path: str) -> pd.DataFrame:
                         except:
                             continue
-        # Extrair tabela de notas usando lattice
         tables_notas = camelot.read_pdf(
             pdf_path,
             pages='all',
             flavor='lattice'
         )
-        # Encontrar tabela de notas
         df_notas = None
         max_rows = 0
@@ -131,7 +125,6 @@ def extrair_tabelas_pdf(pdf_path: str) -> pd.DataFrame:
         if df_notas is None:
             raise ValueError("Tabela de notas não encontrada")
-        # Adicionar informações do aluno ao DataFrame
         df_notas.attrs['nome'] = info_aluno.get('nome', 'Nome não encontrado')
         return df_notas
@@ -140,6 +133,90 @@ def extrair_tabelas_pdf(pdf_path: str) -> pd.DataFrame:
         logger.error(f"Erro na extração das tabelas: {str(e)}")
         raise
 # Funções de plotagem
 def plotar_evolucao_bimestres(disciplinas_dados: List[Dict], temp_dir: str,
                              titulo: Optional[str] = None,

 # Função de extração de tabelas do PDF
 def extrair_tabelas_pdf(pdf_path: str) -> pd.DataFrame:
     try:
         tables_header = camelot.read_pdf(
             pdf_path,
             pages='1',
         )
         info_aluno = {}
         for table in tables_header:
             df = table.df
             for i in range(len(df)):
                         except:
                             continue
         tables_notas = camelot.read_pdf(
             pdf_path,
             pages='all',
             flavor='lattice'
         )
         df_notas = None
         max_rows = 0
         if df_notas is None:
             raise ValueError("Tabela de notas não encontrada")
         df_notas.attrs['nome'] = info_aluno.get('nome', 'Nome não encontrado')
         return df_notas
         logger.error(f"Erro na extração das tabelas: {str(e)}")
         raise
+# Função para identificar disciplinas válidas
+def obter_disciplinas_validas(df: pd.DataFrame) -> List[Dict]:
+    colunas_notas = ['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']
+    colunas_freq = ['%Freq B1', '%Freq B2', '%Freq B3', '%Freq B4']
+    disciplinas_dados = []
+    for _, row in df.iterrows():
+        disciplina = row['Disciplina']
+        if pd.isna(disciplina) or disciplina == '':
+            continue
+        notas = []
+        freqs = []
+        bimestres_cursados = []
+        for i, (col_nota, col_freq) in enumerate(zip(colunas_notas, colunas_freq), 1):
+            nota = converter_nota(row[col_nota])
+            freq = row[col_freq] if col_freq in row else None
+            if nota is not None or (freq and freq != '-'):
+                bimestres_cursados.append(i)
+                notas.append(nota if nota is not None else 0)
+                freqs.append(freq)
+            else:
+                notas.append(None)
+                freqs.append(None)
+        if bimestres_cursados:
+            media_notas = calcular_media_bimestres(notas)
+            media_freq = calcular_frequencia_media(freqs)
+            disciplinas_dados.append({
+                'disciplina': disciplina,
+                'notas': notas,
+                'frequencias': freqs,
+                'media_notas': media_notas,
+                'media_freq': media_freq,
+                'bimestres_cursados': bimestres_cursados
+            })
+    return disciplinas_dados
+# Função de conversão de nota
+def converter_nota(valor) -> Optional[float]:
+    if pd.isna(valor) or valor == '-' or valor == 'N' or valor == '' or valor == 'None':
+        return None
+    if isinstance(valor, str):
+        valor_limpo = valor.strip().upper()
+        if valor_limpo in CONCEITOS_VALIDOS:
+            conceitos_map = {'ET': 10, 'ES': 8, 'EP': 6}
+            return conceitos_map.get(valor_limpo)
+        try:
+            return float(valor_limpo.replace(',', '.'))
+        except:
+            return None
+    if isinstance(valor, (int, float)):
+        return float(valor)
+    return None
+# Funções de cálculo de médias e frequências
+def calcular_media_bimestres(notas: List[float]) -> float:
+    notas_validas = [nota for nota in notas if nota is not None]
+    return sum(notas_validas) / len(notas_validas) if notas_validas else 0
+def calcular_frequencia_media(frequencias: List[str]) -> float:
+    freq_validas = []
+    for freq in frequencias:
+        try:
+            if isinstance(freq, str):
+                freq = freq.strip().replace('%', '').replace(',', '.')
+            if freq and freq != '-':
+                valor = float(freq)
+                if valor > 0:
+                    freq_validas.append(valor)
+        except:
+            continue
+    return sum(freq_validas) / len(freq_validas) if freq_validas else 0
 # Funções de plotagem
 def plotar_evolucao_bimestres(disciplinas_dados: List[Dict], temp_dir: str,
                              titulo: Optional[str] = None,