Spaces:
Running
Running
File size: 2,561 Bytes
5b10a22 1838d87 2375167 050a2a9 1838d87 2375167 050a2a9 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 |
---
title: README
emoji: 🏆
colorFrom: gray
colorTo: purple
sdk: static
pinned: false
---
✨ Service collection, markup and analysis of data for machine learning\
❤️ We provide free services for collecting and marking text datasets in the service Scoutie: 🔗https://scoutie.ru \
🎁 Give all users a free collection time that can be used to create 3 datasets on any topic \
⭐️ Possibilities of the service:
1. Automatic collection of texts from Telegram channels (for more than 350 thousand different channels grouped by topics). ✅
2. Automatic word markup by various means such as: Identifying emotional color, identifying named entities, vectorization (Embedding), filtering of advertising and spam, text clustering to speed up manual markup. ✅
3. Smart filtering tools that will allow you to get the necessary sample of data. ✅
4. Download data in any convenient format: CSV, JSON including the entire dataset or only its filtered representation. ✅
✨ Сервис сбора, разметки и анализа данных для машинного обучения \
❤️ Предоставляем услуги по сбору и разметки текстовых датасетов в сервисе Скаути: https://scoutie.ru \
🎁 Дарим всем пользователям бесплатное время сбора, которые можно использовать для создания 3 датасетов на любую тему \
⭐️ Возможности сервиса:
1. Автоматический сбор текстов из Telegram каналов (Более 350 тысяч различных каналов сгруппированных по темам). ✅
2. Автоматическая разметка текстов различными средствами такими как: Выявление эмоционального окраса, выявление именованных сущностей, векторизация (Embedding), фильтрация рекламы и спама, кластеризация текстов для ускорения ручной разметки. ✅
3. Умные средства фильтрации, которые позволят получить необходимую выборку данных. ✅
4. Скачивание данных в любом удобном формате: CSV, JSON включая весь датасет или только его отфильтрованное представление. ✅
|