{ "cells": [ { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [ "import pandas as pd\n", "import numpy as np\n", "\n", "import os\n", "os.chdir('..')" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "['data', 'model', 'notebooks', 'test.ipynb', 'Untitled-1.ipynb', 'вф']" ] }, "execution_count": 2, "metadata": {}, "output_type": "execute_result" } ], "source": [ "os.listdir('.')" ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
commenttoxic
0Верблюдов-то за что? Дебилы, бл...1.0
1Хохлы, это отдушина затюканого россиянина, мол...1.0
2Собаке - собачья смерть1.0
3Страницу обнови, дебил. Это тоже не оскорблени...1.0
4тебя не убедил 6-страничный пдф в том, что Скр...1.0
.........
14407Вонючий совковый скот прибежал и ноет. А вот и...1.0
14408А кого любить? Гоблина тупорылого что-ли? Или ...1.0
14409Посмотрел Утомленных солнцем 2. И оказалось, ч...0.0
14410КРЫМОТРЕД НАРУШАЕТ ПРАВИЛА РАЗДЕЛА Т.К В НЕМ Н...1.0
14411До сих пор пересматриваю его видео. Орамбо кст...0.0
\n", "

14412 rows × 2 columns

\n", "
" ], "text/plain": [ " comment toxic\n", "0 Верблюдов-то за что? Дебилы, бл... 1.0\n", "1 Хохлы, это отдушина затюканого россиянина, мол... 1.0\n", "2 Собаке - собачья смерть 1.0\n", "3 Страницу обнови, дебил. Это тоже не оскорблени... 1.0\n", "4 тебя не убедил 6-страничный пдф в том, что Скр... 1.0\n", "... ... ...\n", "14407 Вонючий совковый скот прибежал и ноет. А вот и... 1.0\n", "14408 А кого любить? Гоблина тупорылого что-ли? Или ... 1.0\n", "14409 Посмотрел Утомленных солнцем 2. И оказалось, ч... 0.0\n", "14410 КРЫМОТРЕД НАРУШАЕТ ПРАВИЛА РАЗДЕЛА Т.К В НЕМ Н... 1.0\n", "14411 До сих пор пересматриваю его видео. Орамбо кст... 0.0\n", "\n", "[14412 rows x 2 columns]" ] }, "execution_count": 3, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df = pd.read_csv('data/data.csv')\n", "df['comment'] = df['comment'].str.replace('\\n', '', regex=False)\n", "df" ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "toxic\n", "0.0 9586\n", "1.0 4826\n", "Name: count, dtype: int64" ] }, "execution_count": 4, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df['toxic'].value_counts()" ] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.12.4" } }, "nbformat": 4, "nbformat_minor": 2 }