Spaces:
Sleeping
Sleeping
Update app.py
Browse files
app.py
CHANGED
@@ -69,7 +69,9 @@ def download_current_message_database():
|
|
69 |
'Storage_1': 'Редакторы',
|
70 |
'Storage_Ira': 'Ира',
|
71 |
'Storage_Kate': 'Катя',
|
72 |
-
'Storage_Sveta': 'Света'
|
|
|
|
|
73 |
}
|
74 |
|
75 |
# Base GitHub API URL
|
@@ -372,6 +374,32 @@ def update_download_link():
|
|
372 |
clean_model_pie_fig = px.pie(values=clean_model_counts.values, names=clean_model_counts.index, title='Сообщения без корректировок')
|
373 |
contributor_pie_fig = px.pie(values=contributor_counts.values, names=contributor_counts.index, title='Наиболее активные контрибьюторы')
|
374 |
date_message_fig = px.bar(x=date_counts.index, y=date_counts.values, labels={'x': 'Дата', 'y': 'Количество сообщений'}, title='Количество добавленных сообщений по датам')
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
375 |
|
376 |
return (
|
377 |
f"[Скачать базу сообщений]({link})",
|
@@ -382,8 +410,10 @@ def update_download_link():
|
|
382 |
contributor_pie_fig,
|
383 |
date_message_fig,
|
384 |
cumulative_model_fig,
|
385 |
-
cumulative_clean_model_fig,
|
386 |
-
cumulative_author_fig
|
|
|
|
|
387 |
)
|
388 |
|
389 |
else:
|
@@ -1934,7 +1964,7 @@ with gr.Blocks() as demo:
|
|
1934 |
|
1935 |
with gr.Tabs() as tabs:
|
1936 |
|
1937 |
-
# Вкладка 1:
|
1938 |
with gr.TabItem("Рабочее поле", id=0):
|
1939 |
|
1940 |
with gr.Row():
|
@@ -2123,7 +2153,7 @@ with gr.Blocks() as demo:
|
|
2123 |
|
2124 |
gr.Markdown("---")
|
2125 |
|
2126 |
-
# Вкладка 2:
|
2127 |
with gr.TabItem("Аналитика", id=1):
|
2128 |
|
2129 |
with gr.Row():
|
@@ -2146,6 +2176,8 @@ with gr.Blocks() as demo:
|
|
2146 |
cumulative_model_chart = gr.Plot(label="График 5")
|
2147 |
cumulative_clean_model_chart = gr.Plot(label="График 6")
|
2148 |
cumulative_author_chart = gr.Plot(label="График 7")
|
|
|
|
|
2149 |
|
2150 |
gr.Markdown("---")
|
2151 |
|
@@ -2823,8 +2855,10 @@ with gr.Blocks() as demo:
|
|
2823 |
contributor_pie_chart,
|
2824 |
date_message_chart,
|
2825 |
cumulative_model_chart,
|
2826 |
-
cumulative_clean_model_chart,
|
2827 |
-
cumulative_author_chart
|
|
|
|
|
2828 |
]
|
2829 |
)
|
2830 |
|
|
|
69 |
'Storage_1': 'Редакторы',
|
70 |
'Storage_Ira': 'Ира',
|
71 |
'Storage_Kate': 'Катя',
|
72 |
+
'Storage_Sveta': 'Света',
|
73 |
+
'Storage_Lera': 'Лера',
|
74 |
+
'Storage_Dasha': 'Даша',
|
75 |
}
|
76 |
|
77 |
# Base GitHub API URL
|
|
|
374 |
clean_model_pie_fig = px.pie(values=clean_model_counts.values, names=clean_model_counts.index, title='Сообщения без корректировок')
|
375 |
contributor_pie_fig = px.pie(values=contributor_counts.values, names=contributor_counts.index, title='Наиболее активные контрибьюторы')
|
376 |
date_message_fig = px.bar(x=date_counts.index, y=date_counts.values, labels={'x': 'Дата', 'y': 'Количество сообщений'}, title='Количество добавленных сообщений по датам')
|
377 |
+
|
378 |
+
# 1. Распределение сообщений по количеству символов
|
379 |
+
clean_df['Количество символов'] = clean_df['Откорректированное сообщение'].fillna(clean_df['Персонализированное сообщение']).str.len()
|
380 |
+
character_counts = clean_df['Количество символов'].value_counts().sort_index()
|
381 |
+
mean_characters = clean_df['Количество символов'].mean()
|
382 |
+
median_characters = clean_df['Количество символов'].median()
|
383 |
+
|
384 |
+
char_count_fig = px.bar(
|
385 |
+
x=character_counts.index,
|
386 |
+
y=character_counts.values,
|
387 |
+
labels={'x': 'Количество символов', 'y': 'Количество сообщений'},
|
388 |
+
title='Распределение сообщений по количеству символов'
|
389 |
+
)
|
390 |
+
char_count_fig.add_vline(x=mean_characters, line_width=3, line_dash="dash", line_color="green", annotation_text=f"Среднее: {mean_characters:.1f}")
|
391 |
+
char_count_fig.add_vline(x=median_characters, line_width=3, line_dash="dash", line_color="red", annotation_text=f"Медиана: {median_characters:.1f}")
|
392 |
+
|
393 |
+
# 2. Распределение сообщений по количеству предложений
|
394 |
+
clean_df['Количество предложений'] = clean_df['Откорректированное сообщение'].fillna(clean_df['Персонализированное сообщение']).str.split('[.!?]').str.len()
|
395 |
+
sentence_counts = clean_df['Количество предложений'].value_counts().sort_index()
|
396 |
+
|
397 |
+
sentence_count_fig = px.bar(
|
398 |
+
x=sentence_counts.index,
|
399 |
+
y=sentence_counts.values,
|
400 |
+
labels={'x': 'Количество предложений', 'y': 'Количество сообщений'},
|
401 |
+
title='Распределение сообщений по количеству предложений'
|
402 |
+
)
|
403 |
|
404 |
return (
|
405 |
f"[Скачать базу сообщений]({link})",
|
|
|
410 |
contributor_pie_fig,
|
411 |
date_message_fig,
|
412 |
cumulative_model_fig,
|
413 |
+
cumulative_clean_model_fig,
|
414 |
+
cumulative_author_fig,
|
415 |
+
char_count_fig,
|
416 |
+
sentence_count_fig
|
417 |
)
|
418 |
|
419 |
else:
|
|
|
1964 |
|
1965 |
with gr.Tabs() as tabs:
|
1966 |
|
1967 |
+
# Вкладка 1: Рабочее поле
|
1968 |
with gr.TabItem("Рабочее поле", id=0):
|
1969 |
|
1970 |
with gr.Row():
|
|
|
2153 |
|
2154 |
gr.Markdown("---")
|
2155 |
|
2156 |
+
# Вкладка 2: Аналитика
|
2157 |
with gr.TabItem("Аналитика", id=1):
|
2158 |
|
2159 |
with gr.Row():
|
|
|
2176 |
cumulative_model_chart = gr.Plot(label="График 5")
|
2177 |
cumulative_clean_model_chart = gr.Plot(label="График 6")
|
2178 |
cumulative_author_chart = gr.Plot(label="График 7")
|
2179 |
+
character_count_chart = gr.Plot(label="График 8")
|
2180 |
+
sentence_count_chart = gr.Plot(label="График 9")
|
2181 |
|
2182 |
gr.Markdown("---")
|
2183 |
|
|
|
2855 |
contributor_pie_chart,
|
2856 |
date_message_chart,
|
2857 |
cumulative_model_chart,
|
2858 |
+
cumulative_clean_model_chart,
|
2859 |
+
cumulative_author_chart,
|
2860 |
+
character_count_chart,
|
2861 |
+
sentence_count_chart
|
2862 |
]
|
2863 |
)
|
2864 |
|