PipableAI
/

pip-sql-1.3b

@@ -32,22 +32,91 @@ widget:
 [colab_notebook](https://colab.research.google.com/drive/1insSxvc3jjAXe0zmdIjmbG3ttb5mpRgQ?usp=sharing)
-## What have we built?
-A 1.3 bn SQL model that outperforms most SQL expert models and chatgpt on popular benchmarks.
-This is a distilled model built on the deepseek base model.
-Please refer to https://huggingface.co/PipableAI/pip-library-etl-1.3b for our state of the art model.
-## How we built it?
-We used softmax cross entropy and a modified form of policy grad along with Q loss, optimized in an EM set up.
-Loss behaviour in the set up mentioned above -
-![image/png](https://cdn-uploads.huggingface.co/production/uploads/658d8095a2a6a6e0da8bb8a6/I80Ru1r4thoYrLagIWALa.png)
-## Benchmarking :
-For benchmarking purposes we are using Semantic Evaluation for Text-to-SQL with
-Distilled Test Suites, an officially accepted evaluation framework for Spider, SParC, and CoSQL which was proposed by a research team of Yale and Berkeley.
-The benchmark contains 2200 test data points
-Here is the link to run the evaluation:
 [Test Suite SQL Eval](https://github.com/taoyds/test-suite-sql-eval)
@@ -60,18 +129,18 @@ Here is the link to run the evaluation:
 |sqlcoder-7b|60.6|48.2|28.3|20.4|
 |gpt-3.5|58.8|44.7|31.0|28.4|
-We have also benchmarked it on defog eval.
-It contains 200 test data points handpicked by defog team.
-Here is the link to it:
 [Defog SQL-Eval](https://github.com/defog-ai/sql-eval)
-These are the results -
 ![image/png](https://cdn-uploads.huggingface.co/production/uploads/64d32c6b921678fdc9de3302/fFeLSEYBNpQk_JWjFsF5M.png)
 ## License
-The model is open source under apache 2.0. License
 ## Usage
@@ -188,6 +257,3 @@ Which customers did not make any orders? List the first name, middle initial and
 ```sql
 SELECT T1.customer_first_name ,  T1.customer_middle_initial ,  T1.customer_last_name FROM Customers AS T1 WHERE T1.customer_id NOT IN (SELECT T2.customer_id FROM Orders AS T2)
 ```
-### Team
-Avi Kothari, Pratham Gupta, Ritvik Aryan Kalra, Rohan Bhatial, Soham Acharya

 [colab_notebook](https://colab.research.google.com/drive/1insSxvc3jjAXe0zmdIjmbG3ttb5mpRgQ?usp=sharing)
+## Основная информация
+ Основа для файнтюна (FT).
+<antArtifact identifier="sql-model-analysis" type="text/markdown" title="Анализ SQL-модели для файнтюнинга в бизнес-информатике">
+# Анализ базовой модели PipableAI/pip-library-etl-1.3b
+## Основные характеристики модели
+- Размер: 1.3 миллиарда параметров
+- Базовая архитектура: DeepSeek
+- Специализация: ETL (Extract, Transform, Load) и SQL-операции
+- Доступность: открытый доступ через Hugging Face
+- Превосходит ChatGPT в SQL-ориентированных бенчмарках
+## Преимущества для бизнес-информатики МГПУ
+### 1. Техническая оптимальность
+- Оптимальный размер для файнтюнинга (1.3B параметров)
+- Возможность запуска на доступном оборудовании
+- Эффективное использование вычислительных ресурсов
+### 2. Образовательные преимущества
+- Специализация на SQL подходит для курсов по базам данных
+- Поддержка ETL-процессов актуальна для бизнес-аналитики
+- Возможность интеграции в учебные проекты
+### 3. Направления файнтюнинга для МГПУ
+- Адаптация под специфику учебных задач
+- Настройка на корпоративные кейсы
+- Интеграция российских бизнес-практик
+## Рекомендации по файнтюнингу
+### 1. Приоритетные области настройки
+- Работа с российскими СУБД
+- Интеграция отраслевой специфики
+- Адаптация под образовательные задачи
+### 2. Технические аспекты
+- Использование LoRA для эффективной настройки
+- Подготовка специализированных датасетов
+- Валидация на реальных бизнес-кейсах
+### 3. Образовательные компоненты
+- Создание учебных примеров
+- Разработка практических заданий
+- Интеграция в существующие курсы
+## Потенциальные применения
+1. Учебный процесс:
+   - Автоматическая проверка SQL-запросов студентов
+   - Генерация учебных примеров
+   - Поддержка практических занятий
+2. Исследовательская работа:
+   - Анализ больших наборов данных
+   - Поддержка научных исследований
+   - Обработка результатов экспериментов
+3. Практические проекты:
+   - Работа с реальными бизнес-задачами
+   - Создание прототипов решений
+   - Анализ бизнес-процессов
+</antArtifact>
+Эта модель представляет особую ценность для направления бизнес-информатики благодаря своей специализации на SQL и ETL-процессах.
+## Процесс обучения модели
+Реализован через комбинированную функцию потерь, включающую:
+1. Softmax cross entropy (перекрёстная энтропия с софтмакс нормализацией) для оптимизации веро��тностного распределения предсказаний
+2. Модифицированный вариант policy gradient для оптимизации стратегии принятия решений
+3. Q-loss для оценки качества действий
+Оптимизация производилась в рамках EM-фреймворка (Expectation-Maximization), что обеспечивает итеративное улучшение параметров модели через чередование шагов оценки ожидания и максимизации вероятности.
+Такая архитектура потерь позволяет эффективно оптимизировать как точность генерации SQL-запросов, так и стратегическое качество принимаемых моделью решений.
+## Бенчмаркинг :
+ Оценка производительности модели выполнена на основе Semantic Evaluation for Text-to-SQL with Distilled Test Suites - официального фреймворка оценки, разработанного исследовательской группой Yale и Berkeley для бенчмарков Spider, SParC и CoSQL.
+Тестовый набор данных включает 2200 примеров, что обеспечивает статистически значимую оценку качества генерации SQL-запросов и семантической точности модели.
 [Test Suite SQL Eval](https://github.com/taoyds/test-suite-sql-eval)
 |sqlcoder-7b|60.6|48.2|28.3|20.4|
 |gpt-3.5|58.8|44.7|31.0|28.4|
+Мы также протестировали его на defog eval.
+Он содержит 200 точек тестовых данных, отобранных вручную командой defog.
+Вот ссылка на него:
 [Defog SQL-Eval](https://github.com/defog-ai/sql-eval)
+Вот результаты -
 ![image/png](https://cdn-uploads.huggingface.co/production/uploads/64d32c6b921678fdc9de3302/fFeLSEYBNpQk_JWjFsF5M.png)
 ## License
+Модель имеет открытый исходный код под лицензией Apache 2.0.
 ## Usage
 ```sql
 SELECT T1.customer_first_name ,  T1.customer_middle_initial ,  T1.customer_last_name FROM Customers AS T1 WHERE T1.customer_id NOT IN (SELECT T2.customer_id FROM Orders AS T2)
 ```