Spaces:
Running
Running
title: README | |
emoji: 🏆 | |
colorFrom: gray | |
colorTo: purple | |
sdk: static | |
pinned: false | |
✨ Service collection, markup and analysis of data for machine learning\ | |
❤️ We provide free services for collecting and marking text datasets in the service Scoutie: 🔗https://scoutie.ru \ | |
🎁 Give all users a free collection time that can be used to create 3 datasets on any topic \ | |
⭐️ Possibilities of the service: | |
1. Automatic collection of texts from Telegram channels (for more than 350 thousand different channels grouped by topics). ✅ | |
2. Automatic word markup by various means such as: Identifying emotional color, identifying named entities, vectorization (Embedding), filtering of advertising and spam, text clustering to speed up manual markup. ✅ | |
3. Smart filtering tools that will allow you to get the necessary sample of data. ✅ | |
4. Download data in any convenient format: CSV, JSON including the entire dataset or only its filtered representation. ✅ | |
✨ Сервис сбора, разметки и анализа данных для машинного обучения \ | |
❤️ Предоставляем услуги по сбору и разметки текстовых датасетов в сервисе Скаути: https://scoutie.ru \ | |
🎁 Дарим всем пользователям бесплатное время сбора, которые можно использовать для создания 3 датасетов на любую тему \ | |
⭐️ Возможности сервиса: | |
1. Автоматический сбор текстов из Telegram каналов (Более 350 тысяч различных каналов сгруппированных по темам). ✅ | |
2. Автоматическая разметка текстов различными средствами такими как: Выявление эмоционального окраса, выявление именованных сущностей, векторизация (Embedding), фильтрация рекламы и спама, кластеризация текстов для ускорения ручной разметки. ✅ | |
3. Умные средства фильтрации, которые позволят получить необходимую выборку данных. ✅ | |
4. Скачивание данных в любом удобном формате: CSV, JSON включая весь датасет или только его отфильтрованное представление. ✅ | |