Spaces:
Sleeping
Sleeping
Update app.py
Browse files
app.py
CHANGED
@@ -1,9 +1,3 @@
|
|
1 |
-
#!/usr/bin/env python3
|
2 |
-
"""
|
3 |
-
Финальная векторная RAG система для HuggingFace Spaces
|
4 |
-
Адаптированная версия с поддержкой векторного поиска и резервным режимом
|
5 |
-
"""
|
6 |
-
|
7 |
import os
|
8 |
import json
|
9 |
import pickle
|
@@ -214,13 +208,13 @@ class VectorRAGSystem:
|
|
214 |
- 📋 Структурированный вывод: {structured_output}
|
215 |
|
216 |
🚀 **Архитектурные особенности:**
|
|
|
217 |
- 🔎 **Векторный поиск** с text-embedding-3-large
|
218 |
- 📄 **Parent-page enrichment** через PyMuPDF
|
219 |
- 🧠 **LLM реранкинг** для повышения релевантности
|
220 |
- 🤔 **Chain-of-Thought** рассуждения
|
221 |
- 📋 **JSON Schema** для структурированных ответов
|
222 |
- 📊 **Confidence scoring** и детальная аналитика
|
223 |
-
- 📚 **Предобработка** с pdfplumber + таблицы
|
224 |
|
225 |
💡 **Готова к интеллектуальному анализу отчета ПАО Сбербанк 2023!**"""
|
226 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
import os
|
2 |
import json
|
3 |
import pickle
|
|
|
208 |
- 📋 Структурированный вывод: {structured_output}
|
209 |
|
210 |
🚀 **Архитектурные особенности:**
|
211 |
+
- 📚 **Предобработка** PDF файла (текст и таблицы) через pdfplumber
|
212 |
- 🔎 **Векторный поиск** с text-embedding-3-large
|
213 |
- 📄 **Parent-page enrichment** через PyMuPDF
|
214 |
- 🧠 **LLM реранкинг** для повышения релевантности
|
215 |
- 🤔 **Chain-of-Thought** рассуждения
|
216 |
- 📋 **JSON Schema** для структурированных ответов
|
217 |
- 📊 **Confidence scoring** и детальная аналитика
|
|
|
218 |
|
219 |
💡 **Готова к интеллектуальному анализу отчета ПАО Сбербанк 2023!**"""
|
220 |
|