Spaces:

Emil25
/

pi_project

Runtime error

App Files Files Community

Emil25 commited on Dec 17, 2023

Commit

762ba71

1 Parent(s): 51bd1db

Update app.py

Browse files

Files changed (1) hide show

app.py +34 -43

app.py CHANGED Viewed

@@ -1,3 +1,6 @@
 import torch
 import streamlit as st
 import googleapiclient.discovery
@@ -5,22 +8,23 @@ import pandas as pd
 from transformers import pipeline
 import matplotlib.pyplot as plt
 import seaborn as sns
-import os
-import re
 st.title('Анализатор комментариев :red[YouTube] :sunglasses:')
 # Инициализируем модель Hugging Face для анализа тональности текста
 cls_sent = pipeline("sentiment-analysis",
                       "blanchefort/rubert-base-cased-sentiment")
 st.markdown('***')
 st.sidebar.markdown('# Меню')
-# Получаем YouTube API KEY видеоролика для отправки запроса
-API_key = os.getenv("api_key_youtube") #st.sidebar.text_input('YouTube API KEY')
 st.sidebar.markdown('***')
 # Получаем id видеоролика из URL для отправки запроса
@@ -40,9 +44,9 @@ btn_start = st.sidebar.button('Загрузить')
 if btn_start:
     # Запрос к YouTube API для получения комментариев к видео
     api_service_name = "youtube"
-    api_version = "v3"
     youtube = googleapiclient.discovery.build(
-        api_service_name, api_version, developerKey=API_key)
     request = youtube.commentThreads().list(
         part="snippet",
         videoId=vidID,
@@ -62,21 +66,29 @@ if btn_start:
         ])
     comments_df = pd.DataFrame(comments, columns=['author', 'published_at', 'updated_at', 'like_count', 'text'])
-    # Выводим таблицу с комментариями на странице
     st.header('Комментарии из YouTube')
-    selected_columns = ['author', 'published_at', 'text']
-    new_df = comments_df[selected_columns]
-    st.write(new_df)
     st.markdown('***')
     # Выводим heatmap комментариев по часам и датам
     st.header('Комментарии по часам и датам')
-    new_df['published_at'] = pd.to_datetime(new_df['published_at'])
-    new_df['Date'] = new_df['published_at'].dt.date
-    new_df['Hour'] = new_df['published_at'].dt.hour
-    pivot_table = new_df.pivot_table(index='Hour', columns='Date', values='text', aggfunc='count')
     plt.figure(figsize=(10, 6))
     sns.heatmap(pivot_table, cmap='YlGnBu')
     plt.title('Количество комментариев по часам и датам')
@@ -85,32 +97,11 @@ if btn_start:
     st.pyplot(plt)
     st.markdown('***')
-    # Проходим по каждому комментарию в датафрейме
-    # Анализируем тональность комментария с помощью модели Hugging Face
-    # Добавляем результат в список
-    res_list = []
-    with st.spinner('Идет процесс обработки данных ...'):
-        for comment in comments_df['text']:
-            result = cls_sent(comment)
-            res_list.append(result[0])
-    s_label = f'Готово! Загружено {len(res_list)} комментариев'
-    st.success(s_label)
-    # Выводим таблицу с результатами на странице
-    res_df = pd.DataFrame(res_list)
-    st.header("Таблица c результатами работы модели")
-    st.write(res_df)
-    st.markdown('***')
     # Создаем круговую диаграмму
-    data = res_df['label'].value_counts()
     fig, ax = plt.subplots()
     plt.title("Эмоциональная окраска комментариев на YouTube")
-    label = res_df['label'].unique()
     ax.pie(data, labels=label, autopct='%1.1f%%')
     st.pyplot(fig)

+import os
+import re
 import torch
 import streamlit as st
 import googleapiclient.discovery
 from transformers import pipeline
 import matplotlib.pyplot as plt
 import seaborn as sns
 st.title('Анализатор комментариев :red[YouTube] :sunglasses:')
+# Получаем YouTube API KEY из secrets
+DEVELOPER_KEY = os.getenv("api_key_youtube")
+#if not DEVELOPER_KEY:
+#    raise RuntimeError('Key is not set. Check your environment variables.')
 # Инициализируем модель Hugging Face для анализа тональности текста
 cls_sent = pipeline("sentiment-analysis",
                       "blanchefort/rubert-base-cased-sentiment")
 st.markdown('***')
 st.sidebar.markdown('# Меню')
 st.sidebar.markdown('***')
 # Получаем id видеоролика из URL для отправки запроса
 if btn_start:
     # Запрос к YouTube API для получения комментариев к видео
     api_service_name = "youtube"
+    api_version = "v3"
     youtube = googleapiclient.discovery.build(
+        api_service_name, api_version, developerKey=DEVELOPER_KEY)
     request = youtube.commentThreads().list(
         part="snippet",
         videoId=vidID,
         ])
     comments_df = pd.DataFrame(comments, columns=['author', 'published_at', 'updated_at', 'like_count', 'text'])
+    # Получаем таблицу с комментариями на странице
     st.header('Комментарии из YouTube')
+    selected_columns = ['text', 'author', 'published_at']
+    comments_df = comments_df[selected_columns]
+    res_list = []
+    # Анализируем тональность комментария с помощью модели Hugging Face
+    with st.spinner('Идет процесс обработки данных...'):
+        res_list = cls_sent(comments_df['text'].to_list())
+    s_label = f'Готово! Обработано {len(res_list)} комментариев.'
+    st.success(s_label)
+    # Выводим таблицу с результатами на странице
+    full_df = pd.concat([pd.DataFrame(res_list), comments_df], axis=1)
+    st.write(full_df)
     st.markdown('***')
     # Выводим heatmap комментариев по часам и датам
     st.header('Комментарии по часам и датам')
+    full_df['published_at'] = pd.to_datetime(full_df['published_at'])
+    full_df['Date'] = full_df['published_at'].dt.date
+    full_df['Hour'] = full_df['published_at'].dt.hour
+    pivot_table = full_df.pivot_table(index='Hour', columns='Date', values='text', aggfunc='count')
     plt.figure(figsize=(10, 6))
     sns.heatmap(pivot_table, cmap='YlGnBu')
     plt.title('Количество комментариев по часам и датам')
     st.pyplot(plt)
     st.markdown('***')
     # Создаем круговую диаграмму
+    st.header('Эмоциональная окраска комментариев на YouTube')
+    data = full_df['label'].value_counts()
     fig, ax = plt.subplots()
     plt.title("Эмоциональная окраска комментариев на YouTube")
+    label = full_df['label'].unique()
     ax.pie(data, labels=label, autopct='%1.1f%%')
     st.pyplot(fig)