File size: 2,561 Bytes
5b10a22
 
 
 
 
 
 
 
 
1838d87
 
 
2375167
050a2a9
 
 
 
 
1838d87
 
 
2375167
050a2a9
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
---
title: README
emoji: 🏆
colorFrom: gray
colorTo: purple
sdk: static
pinned: false
---

✨ Service collection, markup and analysis of data for machine learning\
❤️ We provide free services for collecting and marking text datasets in the service Scoutie: 🔗https://scoutie.ru \
🎁 Give all users a free collection time that can be used to create 3 datasets on any topic \
⭐️ Possibilities of the service:
1. Automatic collection of texts from Telegram channels (for more than 350 thousand different channels grouped by topics). ✅
2. Automatic word markup by various means such as: Identifying emotional color, identifying named entities, vectorization (Embedding), filtering of advertising and spam, text clustering to speed up manual markup. ✅
3. Smart filtering tools that will allow you to get the necessary sample of data. ✅
4. Download data in any convenient format: CSV, JSON including the entire dataset or only its filtered representation. ✅

✨ Сервис сбора, разметки и анализа данных для машинного обучения \
❤️ Предоставляем услуги по сбору и разметки текстовых датасетов в сервисе Скаути:  https://scoutie.ru \
🎁 Дарим всем пользователям бесплатное время сбора, которые можно использовать для создания 3 датасетов на любую тему \
⭐️ Возможности сервиса:
1. Автоматический сбор текстов из Telegram каналов (Более 350 тысяч различных каналов сгруппированных по темам). ✅
2. Автоматическая разметка текстов различными средствами такими как: Выявление эмоционального окраса, выявление именованных сущностей, векторизация (Embedding), фильтрация рекламы и спама, кластеризация текстов для ускорения ручной разметки. ✅ 
3. Умные средства фильтрации, которые позволят получить необходимую выборку данных. ✅ 
4. Скачивание данных в любом удобном формате: CSV, JSON включая весь датасет или только его отфильтрованное представление. ✅