Spaces:

histlearn
/

tarefasCMSP

Sleeping

App Files Files Community

histlearn commited on Jul 8, 2024

Commit

a5ac2dd

verified ·

1 Parent(s): 7fa3164

Update app.py

Browse files

Files changed (1) hide show

app.py +26 -6

app.py CHANGED Viewed

@@ -5,6 +5,7 @@ import os
 import matplotlib.pyplot as plt
 from datetime import timedelta
 from fpdf import FPDF
 def parse_duration(duration_str):
     try:
@@ -51,7 +52,7 @@ def match_alunos(tarefas_csv_path, alunos_csv_path, contador_csv_path):
     tarefas_df.columns = tarefas_df.columns.str.strip()
     alunos_df.columns = alunos_df.columns.str.strip()
-    if 'Aluno' not in tarefas_df.columns or 'Nota' not in tarefas_df.columns or 'Duração' not in tarefas_df.columns:
         print(f"Colunas 'Aluno', 'Nota' ou 'Duração' não encontradas no arquivo {tarefas_csv_path}. Pulando este arquivo.")
         return
@@ -105,6 +106,11 @@ def match_alunos(tarefas_csv_path, alunos_csv_path, contador_csv_path):
     return result_df
 def process_all_tarefas_in_directory(directory, alunos_csv_path, contador_csv_path, relatorio_csv_path):
     tarefas_files = [os.path.join(directory, f) for f in os.listdir(directory) if f.endswith('.csv') and f not in ['alunos_fim.csv', 'contador_tarefas.csv']]
@@ -120,14 +126,21 @@ def process_relatorios(contador_csv_path, relatorio_csv_path):
     contador_df['Tempo Médio por Tarefa'] = (contador_df['Total Tempo'] / contador_df['Tarefas Completadas']).apply(format_timedelta)
     contador_df['Total Tempo'] = contador_df['Total Tempo'].apply(format_timedelta)
     contador_df = contador_df.sort_values(by='Tarefas Completadas', ascending=False)
     contador_df.to_csv(relatorio_csv_path, index=False)
-    return contador_df
-def generate_pdf_report(dataframe, output_pdf_path):
     class PDF(FPDF):
         def header(self):
             self.set_font('Arial', 'B', 12)
             self.cell(0, 10, 'Relatório de Tarefas', 0, 1, 'C')
         def footer(self):
             self.set_y(-15)
@@ -144,12 +157,19 @@ def generate_pdf_report(dataframe, output_pdf_path):
                 self.cell(col_width, row_height * 2, col, border=1)
             self.ln(row_height * 2)
-            # Adiciona os dados
             self.set_font('Arial', '', 10)
             for row in dataframe.itertuples(index=False):
                 for item in row:
                     self.cell(col_width, row_height * 2, str(item), border=1)
                 self.ln(row_height * 2)
         def add_image(self, image_path):
             self.add_page()
@@ -228,14 +248,14 @@ def processar_relatorio(html_file, tarefa_files):
     contador_csv_path = os.path.join(output_directory, "contador_tarefas.csv")
     relatorio_csv_path = os.path.join(output_directory, "relatorio_final.csv")
     process_all_tarefas_in_directory(output_directory, alunos_csv_path, contador_csv_path, relatorio_csv_path)
-    df = process_relatorios(contador_csv_path, relatorio_csv_path)
     # Salva o relatório em HTML e PDF
     html_output_path = os.path.join(output_directory, "relatorio_final.html")
     df.to_html(html_output_path, index=False)
     pdf_output_path = os.path.join(output_directory, "relatorio_final.pdf")
-    generate_pdf_report(df, pdf_output_path)
     return df.to_html(index=False), html_output_path, pdf_output_path

 import matplotlib.pyplot as plt
 from datetime import timedelta
 from fpdf import FPDF
+import numpy as np
 def parse_duration(duration_str):
     try:
     tarefas_df.columns = tarefas_df.columns.str.strip()
     alunos_df.columns = alunos_df.columns.str.strip()
+    if 'Aluno' not in tarefas_df.columns or 'Nota' not in tarefas_df.columns or 'Duração' não in tarefas_df.columns:
         print(f"Colunas 'Aluno', 'Nota' ou 'Duração' não encontradas no arquivo {tarefas_csv_path}. Pulando este arquivo.")
         return
     return result_df
+def remove_outliers(data, column, threshold=3):
+    mean = data[column].mean()
+    std = data[column].std()
+    return data[(data[column] > mean - threshold * std) & (data[column] < mean + threshold * std)]
 def process_all_tarefas_in_directory(directory, alunos_csv_path, contador_csv_path, relatorio_csv_path):
     tarefas_files = [os.path.join(directory, f) for f in os.listdir(directory) if f.endswith('.csv') and f not in ['alunos_fim.csv', 'contador_tarefas.csv']]
     contador_df['Tempo Médio por Tarefa'] = (contador_df['Total Tempo'] / contador_df['Tarefas Completadas']).apply(format_timedelta)
     contador_df['Total Tempo'] = contador_df['Total Tempo'].apply(format_timedelta)
     contador_df = contador_df.sort_values(by='Tarefas Completadas', ascending=False)
+    # Remove outliers e calcula o tempo médio por tarefa da turma
+    tempo_medio_por_tarefa = remove_outliers(contador_df, 'Tempo Médio por Tarefa')
+    media_tempo_medio_turma = tempo_medio_por_tarefa['Tempo Médio por Tarefa'].mean()
+    media_tempo_medio_turma = format_timedelta(media_tempo_medio_turma)
     contador_df.to_csv(relatorio_csv_path, index=False)
+    return contador_df, media_tempo_medio_turma
+def generate_pdf_report(dataframe, media_tempo_medio_turma, output_pdf_path):
     class PDF(FPDF):
         def header(self):
             self.set_font('Arial', 'B', 12)
             self.cell(0, 10, 'Relatório de Tarefas', 0, 1, 'C')
+            self.cell(0, 10, f'Tempo Médio por Tarefa da Turma (ajustado): {media_tempo_medio_turma}', 0, 1, 'C')
         def footer(self):
             self.set_y(-15)
                 self.cell(col_width, row_height * 2, col, border=1)
             self.ln(row_height * 2)
+            # Adiciona os dados com quebras de página
             self.set_font('Arial', '', 10)
             for row in dataframe.itertuples(index=False):
                 for item in row:
                     self.cell(col_width, row_height * 2, str(item), border=1)
                 self.ln(row_height * 2)
+                if self.get_y() > self.page_break_trigger - 2 * row_height:
+                    self.add_page()
+                    self.set_font('Arial', 'B', 10)
+                    for col in dataframe.columns:
+                        self.cell(col_width, row_height * 2, col, border=1)
+                    self.ln(row_height * 2)
+                    self.set_font('Arial', '', 10)
         def add_image(self, image_path):
             self.add_page()
     contador_csv_path = os.path.join(output_directory, "contador_tarefas.csv")
     relatorio_csv_path = os.path.join(output_directory, "relatorio_final.csv")
     process_all_tarefas_in_directory(output_directory, alunos_csv_path, contador_csv_path, relatorio_csv_path)
+    df, media_tempo_medio_turma = process_relatorios(contador_csv_path, relatorio_csv_path)
     # Salva o relatório em HTML e PDF
     html_output_path = os.path.join(output_directory, "relatorio_final.html")
     df.to_html(html_output_path, index=False)
     pdf_output_path = os.path.join(output_directory, "relatorio_final.pdf")
+    generate_pdf_report(df, media_tempo_medio_turma, pdf_output_path)
     return df.to_html(index=False), html_output_path, pdf_output_path