Spaces:

histlearn
/

tarefasCMSP

Sleeping

App Files Files Community

histlearn commited on Dec 15, 2024

Commit

a2c6ed7

verified ·

1 Parent(s): d8775d7

Update app.py

Browse files

Files changed (1) hide show

app.py +28 -32

app.py CHANGED Viewed

@@ -121,40 +121,35 @@ class StudentAnalyzer:
         """Calcula métricas de desempenho dos alunos, eliminando duplicatas e normalizando valores."""
         try:
             metrics_df = pd.DataFrame()
-            # Agrupar por aluno para eliminar duplicatas
-            grouped_tasks = self.tarefas_df.groupby(['Aluno_Pattern']).agg({
-                'Aluno': 'first',  # Mantém o primeiro nome encontrado
-                'Duração': 'sum',  # Soma total do tempo
-                'Nota': 'sum',     # Soma total dos acertos
             }).reset_index()
-            # Contar número de tarefas por aluno
-            task_counts = self.tarefas_df.groupby('Aluno_Pattern').size().reset_index(name='total_tarefas')
-            grouped_tasks = grouped_tasks.merge(task_counts, on='Aluno_Pattern', how='left')
-            for _, aluno in self.alunos_df.iterrows():
                 aluno_pattern = aluno['Aluno_Pattern']
                 aluno_data = grouped_tasks[grouped_tasks['Aluno_Pattern'] == aluno_pattern]
                 if not aluno_data.empty:
-                    # Calcular métricas por aluno
-                    total_tarefas = aluno_data['total_tarefas'].iloc[0]
-                    total_acertos = aluno_data['Nota'].iloc[0]
-                    duracao_total = aluno_data['Duração'].iloc[0]
                     metrics = {
                         'Nome do Aluno': aluno['Nome do Aluno'],
-                        'Tarefas Completadas': total_tarefas,
-                        'Acertos Absolutos': total_acertos,
-                        'Total Tempo': str(duracao_total),
-                        'Tempo Médio por Tarefa': str(duracao_total / total_tarefas if total_tarefas > 0 else timedelta(0))
                     }
                     metrics_df = pd.concat([metrics_df, pd.DataFrame([metrics])], ignore_index=True)
-            # Ordenar por acertos e resetar índice
-            return metrics_df.sort_values('Acertos Absolutos', ascending=False).reset_index(drop=True)
         except Exception as e:
             logging.error(f"Erro ao calcular métricas: {str(e)}")
             raise
@@ -407,12 +402,12 @@ class ReportGenerator:
             pdf.set_fill_color(240, 240, 240)
             # Calcular estatísticas do nível
-            total_questoes_por_tarefa = 10  # Número máximo de questões por tarefa
             media_acertos = alunos_nivel['Acertos Absolutos'].mean()
             media_tarefas = alunos_nivel['Tarefas Completadas'].mean()
-            pontos_possiveis = media_tarefas * total_questoes_por_tarefa
-            taxa_media = (media_acertos / pontos_possiveis * 100) if pontos_possiveis > 0 else 0
             # Cabeçalho da seção
             pdf.cell(0, 10, f'Detalhamento - Nível {nivel}', 0, 1, 'L', True)
@@ -441,13 +436,14 @@ class ReportGenerator:
             # Dados dos alunos
             pdf.set_font('Arial', '', 10)
             for i, (_, row) in enumerate(alunos_nivel.iterrows()):
                 # Alternar cores das linhas
                 fill_color = (248, 248, 248) if i % 2 == 0 else (255, 255, 255)
                 pdf.set_fill_color(*fill_color)
-                # Calcular taxa de aproveitamento normalizada
-                pontos_possiveis = row['Tarefas Completadas'] * total_questoes_por_tarefa
-                taxa_aproveitamento = (row['Acertos Absolutos'] / pontos_possiveis * 100) if pontos_possiveis > 0 else 0
                 taxa_aproveitamento = min(taxa_aproveitamento, 100)  # Limitar a 100%
                 # Formatar tempo

         """Calcula métricas de desempenho dos alunos, eliminando duplicatas e normalizando valores."""
         try:
             metrics_df = pd.DataFrame()
+            # Agrupar por Aluno_Pattern e Nome do Aluno para eliminar duplicatas completamente
+            grouped_tasks = self.tarefas_df.groupby(['Aluno_Pattern', 'Nome do Aluno']).agg({
+                'Duração': 'sum',
+                'Nota': 'sum'
             }).reset_index()
+            # Contar número de tarefas únicas por aluno
+            task_counts = self.tarefas_df.groupby(['Aluno_Pattern', 'Nome do Aluno']).size().reset_index(name='total_tarefas')
+            grouped_tasks = grouped_tasks.merge(task_counts, on=['Aluno_Pattern', 'Nome do Aluno'], how='left')
+            # Processar cada aluno uma única vez
+            for _, aluno in self.alunos_df.drop_duplicates(subset=['Aluno_Pattern', 'Nome do Aluno']).iterrows():
                 aluno_pattern = aluno['Aluno_Pattern']
                 aluno_data = grouped_tasks[grouped_tasks['Aluno_Pattern'] == aluno_pattern]
                 if not aluno_data.empty:
                     metrics = {
                         'Nome do Aluno': aluno['Nome do Aluno'],
+                        'Tarefas Completadas': aluno_data['total_tarefas'].iloc[0],
+                        'Acertos Absolutos': aluno_data['Nota'].iloc[0],
+                        'Total Tempo': str(aluno_data['Duração'].iloc[0]),
+                        'Tempo Médio por Tarefa': str(aluno_data['Duração'].iloc[0] / aluno_data['total_tarefas'].iloc[0]
+                                                    if aluno_data['total_tarefas'].iloc[0] > 0 else timedelta(0))
                     }
                     metrics_df = pd.concat([metrics_df, pd.DataFrame([metrics])], ignore_index=True)
+            return metrics_df.sort_values('Acertos Absolutos', ascending=False).drop_duplicates(subset=['Nome do Aluno']).reset_index(drop=True)
         except Exception as e:
             logging.error(f"Erro ao calcular métricas: {str(e)}")
             raise
             pdf.set_fill_color(240, 240, 240)
             # Calcular estatísticas do nível
+            questoes_por_tarefa = 10  # Número máximo de questões por tarefa
             media_acertos = alunos_nivel['Acertos Absolutos'].mean()
             media_tarefas = alunos_nivel['Tarefas Completadas'].mean()
+            total_questoes_possiveis = media_tarefas * questoes_por_tarefa
+            taxa_media = (media_acertos / total_questoes_possiveis * 100) if total_questoes_possiveis > 0 else 0
             # Cabeçalho da seção
             pdf.cell(0, 10, f'Detalhamento - Nível {nivel}', 0, 1, 'L', True)
             # Dados dos alunos
             pdf.set_font('Arial', '', 10)
             for i, (_, row) in enumerate(alunos_nivel.iterrows()):
                 # Alternar cores das linhas
                 fill_color = (248, 248, 248) if i % 2 == 0 else (255, 255, 255)
                 pdf.set_fill_color(*fill_color)
+                # Calcular taxa de aproveitamento normalizada corretamente
+                total_questoes = row['Tarefas Completadas'] * questoes_por_tarefa
+                taxa_aproveitamento = (row['Acertos Absolutos'] / total_questoes * 100) if total_questoes > 0 else 0
                 taxa_aproveitamento = min(taxa_aproveitamento, 100)  # Limitar a 100%
                 # Formatar tempo