Spaces:

RMakushkin
/

test_2_2

Sleeping

App Files Files Community

RMakushkin commited on Dec 15, 2023

Commit

973f02b

1 Parent(s): 082865b

Upload 02_🔥_Results (2).py

Browse files

Files changed (1) hide show

pages/02_🔥_Results (2).py +39 -0

pages/02_🔥_Results (2).py ADDED Viewed

	@@ -0,0 +1,39 @@

+import streamlit as st
+from PIL import Image, ImageOps
+import matplotlib.pyplot as plt
+st.write("""
+ ## 📝 Итоги проекта Рекомендательные системы.
+""")
+"""
+###### 1. Парсинг профильных сайтов, итоговый с kino.mail.ru.
+"""
+st.image('images/mem.jpg', width=400)
+"""
+###### 2. Сбор и анализ информации с киносервисов. Формирование датасета. Итоговый размер - 14939 объектов.
+"""
+col1, col2 = st.columns(2)
+with col1:
+    st.image('images/1.jpeg')
+with col2:
+    st.image('images/2.jpeg')
+# st.image('images/1.png')
+"""
+###### 3. Предобработка данных от лишных символов и пропусков.
+"""
+st.image('images/3.jpeg')
+st.image('images/4.jpeg')
+"""
+###### 4. Векторизация с использованием очередной модели RuBERT
+"""
+st.write("По классике использовался rubert-base-cased-sentence от DeepPavlov")
+st.write("Предобученная на русском датасете модель для классификации текстов")
+st.write("Показала себя лучше, чем узкопрофильные модели от sentence_tran, т.к. они мультиязычные и имеют меньший словарный запас")
+st.write("rubert_tiny_2 также показал себя не с лучшей стороны")
+st.write("По процессу все стандартно, токенизация, пэдинг, обрезание...вектор")