Test_Pipeline_v7

Sleeping

App Files Files Community

fruitpicker01 commited on Sep 19, 2024

Commit

b33f4f3

verified ·

1 Parent(s): ded5362

Update app.py

Browse files

Files changed (1) hide show

app.py +41 -7

app.py CHANGED Viewed

@@ -69,7 +69,9 @@ def download_current_message_database():
         'Storage_1': 'Редакторы',
         'Storage_Ira': 'Ира',
         'Storage_Kate': 'Катя',
-        'Storage_Sveta': 'Света'
     }
     # Base GitHub API URL
@@ -372,6 +374,32 @@ def update_download_link():
         clean_model_pie_fig = px.pie(values=clean_model_counts.values, names=clean_model_counts.index, title='Сообщения без корректировок')
         contributor_pie_fig = px.pie(values=contributor_counts.values, names=contributor_counts.index, title='Наиболее активные контрибьюторы')
         date_message_fig = px.bar(x=date_counts.index, y=date_counts.values, labels={'x': 'Дата', 'y': 'Количество сообщений'}, title='Количество добавленных сообщений по датам')
         return (
             f"[Скачать базу сообщений]({link})",
@@ -382,8 +410,10 @@ def update_download_link():
             contributor_pie_fig,
             date_message_fig,
             cumulative_model_fig,
-            cumulative_clean_model_fig,  # Новый график
-            cumulative_author_fig        # Новый график
         )
     else:
@@ -1934,7 +1964,7 @@ with gr.Blocks() as demo:
     with gr.Tabs() as tabs:
-        # Вкладка 1: Исходные данные
         with gr.TabItem("Рабочее поле", id=0):
             with gr.Row():
@@ -2123,7 +2153,7 @@ with gr.Blocks() as demo:
             gr.Markdown("---")
-        # Вкладка 2: Промпты
         with gr.TabItem("Аналитика", id=1):
             with gr.Row():
@@ -2146,6 +2176,8 @@ with gr.Blocks() as demo:
             cumulative_model_chart = gr.Plot(label="График 5")
             cumulative_clean_model_chart = gr.Plot(label="График 6")
             cumulative_author_chart = gr.Plot(label="График 7")
             gr.Markdown("---")
@@ -2823,8 +2855,10 @@ with gr.Blocks() as demo:
             contributor_pie_chart,
             date_message_chart,
             cumulative_model_chart,
-            cumulative_clean_model_chart,  # Новый график
-            cumulative_author_chart        # Новый график
         ]
     )

         'Storage_1': 'Редакторы',
         'Storage_Ira': 'Ира',
         'Storage_Kate': 'Катя',
+        'Storage_Sveta': 'Света',
+        'Storage_Lera': 'Лера',
+        'Storage_Dasha': 'Даша',
     }
     # Base GitHub API URL
         clean_model_pie_fig = px.pie(values=clean_model_counts.values, names=clean_model_counts.index, title='Сообщения без корректировок')
         contributor_pie_fig = px.pie(values=contributor_counts.values, names=contributor_counts.index, title='Наиболее активные контрибьюторы')
         date_message_fig = px.bar(x=date_counts.index, y=date_counts.values, labels={'x': 'Дата', 'y': 'Количество сообщений'}, title='Количество добавленных сообщений по датам')
+        # 1. Распределение сообщений по количеству символов
+        clean_df['Количество символов'] = clean_df['Откорректированное сообщение'].fillna(clean_df['Персонализированное сообщение']).str.len()
+        character_counts = clean_df['Количество символов'].value_counts().sort_index()
+        mean_characters = clean_df['Количество символов'].mean()
+        median_characters = clean_df['Количество символов'].median()
+        char_count_fig = px.bar(
+            x=character_counts.index,
+            y=character_counts.values,
+            labels={'x': 'Количество символов', 'y': 'Количество сообщений'},
+            title='Распределение сообщений по количеству символов'
+        )
+        char_count_fig.add_vline(x=mean_characters, line_width=3, line_dash="dash", line_color="green", annotation_text=f"Среднее: {mean_characters:.1f}")
+        char_count_fig.add_vline(x=median_characters, line_width=3, line_dash="dash", line_color="red", annotation_text=f"Медиана: {median_characters:.1f}")
+        # 2. Распределение сообщений по количеству предложений
+        clean_df['Количество предложений'] = clean_df['Откорректированное сообщение'].fillna(clean_df['Персонализированное сообщение']).str.split('[.!?]').str.len()
+        sentence_counts = clean_df['Количество предложений'].value_counts().sort_index()
+        sentence_count_fig = px.bar(
+            x=sentence_counts.index,
+            y=sentence_counts.values,
+            labels={'x': 'Количество предложений', 'y': 'Количество сообщений'},
+            title='Распределение сообщений по количеству предложений'
+        )
         return (
             f"[Скачать базу сообщений]({link})",
             contributor_pie_fig,
             date_message_fig,
             cumulative_model_fig,
+            cumulative_clean_model_fig,
+            cumulative_author_fig,
+            char_count_fig,
+            sentence_count_fig
         )
     else:
     with gr.Tabs() as tabs:
+        # Вкладка 1: Рабочее поле
         with gr.TabItem("Рабочее поле", id=0):
             with gr.Row():
             gr.Markdown("---")
+        # Вкладка 2: Аналитика
         with gr.TabItem("Аналитика", id=1):
             with gr.Row():
             cumulative_model_chart = gr.Plot(label="График 5")
             cumulative_clean_model_chart = gr.Plot(label="График 6")
             cumulative_author_chart = gr.Plot(label="График 7")
+            character_count_chart = gr.Plot(label="График 8")
+            sentence_count_chart = gr.Plot(label="График 9")
             gr.Markdown("---")
             contributor_pie_chart,
             date_message_chart,
             cumulative_model_chart,
+            cumulative_clean_model_chart,
+            cumulative_author_chart,
+            character_count_chart,
+            sentence_count_chart
         ]
     )