Spaces:

histlearn
/

tarefasCMSP

Sleeping

App Files Files Community

histlearn commited on Jul 1, 2024

Commit

04ab3a5

verified ·

1 Parent(s): 983adac

Update app.py

Browse files

Files changed (1) hide show

app.py +39 -20

app.py CHANGED Viewed

@@ -39,20 +39,35 @@ def extract_aluno_pattern(nome):
         return match.group(1) if match else None
     return None
-def match_alunos(tarefas_csv_path, alunos_csv_path, contador_df):
     try:
         tarefas_df = pd.read_csv(tarefas_csv_path)
         alunos_df = pd.read_csv(alunos_csv_path)
     except pd.errors.EmptyDataError:
         print(f"Arquivo {tarefas_csv_path} ou {alunos_csv_path} está vazio. Pulando...")
-        return contador_df
     tarefas_df.columns = tarefas_df.columns.str.strip()
     alunos_df.columns = alunos_df.columns.str.strip()
     if 'Aluno' not in tarefas_df.columns or 'Nota' not in tarefas_df.columns or 'Duração' not in tarefas_df.columns:
         print(f"Colunas 'Aluno', 'Nota' ou 'Duração' não encontradas no arquivo {tarefas_csv_path}. Pulando este arquivo.")
-        return contador_df
     def generate_aluno_pattern(ra, dig_ra):
         ra_str = str(ra).zfill(9)
@@ -61,11 +76,23 @@ def match_alunos(tarefas_csv_path, alunos_csv_path, contador_df):
     alunos_df['Aluno_Pattern'] = alunos_df.apply(lambda row: generate_aluno_pattern(row['RA'], row['Dig. RA']), axis=1)
     tarefas_df['Aluno_Pattern'] = tarefas_df['Aluno'].apply(extract_aluno_pattern)
     tarefas_df['Duração'] = tarefas_df['Duração'].apply(parse_duration)
     matched_alunos = alunos_df[alunos_df['Aluno_Pattern'].isin(tarefas_df['Aluno_Pattern'])]
     result_df = matched_alunos[['Nome do Aluno']].drop_duplicates()
     for aluno in result_df['Nome do Aluno']:
@@ -75,35 +102,27 @@ def match_alunos(tarefas_csv_path, alunos_csv_path, contador_df):
         tempo_total = aluno_tarefas['Duração'].sum()
         if aluno in contador_df['Nome do Aluno'].values:
-            contador_df.loc[contador_df['Nome do Aluno'] == aluno, 'Tarefas Completadas'] += len(aluno_tarefas)
             contador_df.loc[contador_df['Nome do Aluno'] == aluno, 'Acertos Absolutos'] += nota_total
             current_total_tempo = pd.to_timedelta(contador_df.loc[contador_df['Nome do Aluno'] == aluno, 'Total Tempo'].values[0])
             contador_df.loc[contador_df['Nome do Aluno'] == aluno, 'Total Tempo'] = str(current_total_tempo + tempo_total)
         else:
-            contador_df = pd.concat([contador_df, pd.DataFrame({'Nome do Aluno': [aluno], 'Tarefas Completadas': [len(aluno_tarefas)], 'Acertos Absolutos': [nota_total], 'Total Tempo': [str(tempo_total)]})], ignore_index=True)
-    return contador_df
-def process_all_tarefas_in_directory(directory, alunos_csv_path, contador_csv_path, relatorio_csv_path):
-    tarefas_files = [os.path.join(directory, f) for f in os.listdir(directory) if f.endswith('.csv') and f not in ['alunos_fim.csv', 'contador_tarefas.csv', 'relatorio_final.csv']]
-    try:
-        contador_df = pd.read_csv(contador_csv_path)
-    except FileNotFoundError:
-        contador_df = pd.DataFrame(columns=['Nome do Aluno', 'Tarefas Completadas', 'Acertos Absolutos', 'Total Tempo'])
     for i, tarefas_file in enumerate(tarefas_files):
         print(f"Processando arquivo {i+1}/{len(tarefas_files)}: {tarefas_file}")
-        contador_df = match_alunos(tarefas_file, alunos_csv_path, contador_df)
         print(f"Arquivo {tarefas_file} processado.")
-    # Recontar as tarefas completadas para garantir a contagem correta
-    aluno_counts = tarefas_df['Aluno_Pattern'].value_counts()
-    for aluno_pattern, count in aluno_counts.items():
-        if aluno_pattern in contador_df['Nome do Aluno'].values:
-            contador_df.loc[contador_df['Nome do Aluno'] == aluno_pattern, 'Tarefas Completadas'] = count
-    contador_df.to_csv(contador_csv_path, index=False)
     process_relatorios(contador_csv_path, relatorio_csv_path)
 def process_relatorios(contador_csv_path, relatorio_csv_path):

         return match.group(1) if match else None
     return None
+def match_alunos(tarefas_csv_path, alunos_csv_path, contador_csv_path):
     try:
         tarefas_df = pd.read_csv(tarefas_csv_path)
         alunos_df = pd.read_csv(alunos_csv_path)
     except pd.errors.EmptyDataError:
         print(f"Arquivo {tarefas_csv_path} ou {alunos_csv_path} está vazio. Pulando...")
+        return
+    print(f"Tarefas DataFrame (antes da normalização):\n{tarefas_df.head()}")
+    print(f"Alunos DataFrame (antes da normalização):\n{alunos_df.head()}")
     tarefas_df.columns = tarefas_df.columns.str.strip()
     alunos_df.columns = alunos_df.columns.str.strip()
     if 'Aluno' not in tarefas_df.columns or 'Nota' not in tarefas_df.columns or 'Duração' not in tarefas_df.columns:
         print(f"Colunas 'Aluno', 'Nota' ou 'Duração' não encontradas no arquivo {tarefas_csv_path}. Pulando este arquivo.")
+        return
+    try:
+        contador_df = pd.read_csv(contador_csv_path)
+    except FileNotFoundError:
+        contador_df = pd.DataFrame(columns=['Nome do Aluno', 'Tarefas Completadas', 'Acertos Absolutos', 'Total Tempo'])
+    if 'Tarefas Completadas' not in contador_df.columns:
+        contador_df['Tarefas Completadas'] = 0
+    if 'Acertos Absolutos' not in contador_df.columns:
+        contador_df['Acertos Absolutos'] = 0
+    if 'Total Tempo' not in contador_df.columns:
+        contador_df['Total Tempo'] = '00:00:00'
     def generate_aluno_pattern(ra, dig_ra):
         ra_str = str(ra).zfill(9)
     alunos_df['Aluno_Pattern'] = alunos_df.apply(lambda row: generate_aluno_pattern(row['RA'], row['Dig. RA']), axis=1)
+    print(f"Alunos DataFrame (com padrão):\n{alunos_df.head()}")
+    def extract_aluno_pattern(nome):
+        if isinstance(nome, str):
+            match = re.search(r'\d+.*', nome.lower())
+            return match.group(0) if match else None
+        return None
     tarefas_df['Aluno_Pattern'] = tarefas_df['Aluno'].apply(extract_aluno_pattern)
     tarefas_df['Duração'] = tarefas_df['Duração'].apply(parse_duration)
+    print(f"Tarefas DataFrame (com padrão):\n{tarefas_df.head()}")
     matched_alunos = alunos_df[alunos_df['Aluno_Pattern'].isin(tarefas_df['Aluno_Pattern'])]
+    print(f"Matched Alunos DataFrame:\n{matched_alunos.head()}")
     result_df = matched_alunos[['Nome do Aluno']].drop_duplicates()
     for aluno in result_df['Nome do Aluno']:
         tempo_total = aluno_tarefas['Duração'].sum()
         if aluno in contador_df['Nome do Aluno'].values:
+            contador_df.loc[contador_df['Nome do Aluno'] == aluno, 'Tarefas Completadas'] += 1
             contador_df.loc[contador_df['Nome do Aluno'] == aluno, 'Acertos Absolutos'] += nota_total
             current_total_tempo = pd.to_timedelta(contador_df.loc[contador_df['Nome do Aluno'] == aluno, 'Total Tempo'].values[0])
             contador_df.loc[contador_df['Nome do Aluno'] == aluno, 'Total Tempo'] = str(current_total_tempo + tempo_total)
         else:
+            contador_df = pd.concat([contador_df, pd.DataFrame({'Nome do Aluno': [aluno], 'Tarefas Completadas': [1], 'Acertos Absolutos': [nota_total], 'Total Tempo': [str(tempo_total)]})], ignore_index=True)
+    print(f"Contador DataFrame (atualizado):\n{contador_df.head()}")
+    contador_df.to_csv(contador_csv_path, index=False)
+    return result_df
+def process_all_tarefas_in_directory(directory, alunos_csv_path, contador_csv_path, relatorio_csv_path):
+    tarefas_files = [os.path.join(directory, f) for f in os.listdir(directory) if f.endswith('.csv') and f not in ['alunos_fim.csv', 'contador_tarefas.csv']]
     for i, tarefas_file in enumerate(tarefas_files):
         print(f"Processando arquivo {i+1}/{len(tarefas_files)}: {tarefas_file}")
+        match_alunos(tarefas_file, alunos_csv_path, contador_csv_path)
         print(f"Arquivo {tarefas_file} processado.")
     process_relatorios(contador_csv_path, relatorio_csv_path)
 def process_relatorios(contador_csv_path, relatorio_csv_path):