Spaces:

quantumbit
/

rag-bajaj

Sleeping

App Files Files Community

quantumbit commited on 12 days ago

Commit

4cc9df6

verified ·

1 Parent(s): a022b57

Delete config

Browse files

Files changed (2) hide show

config/__init__.py +0 -1
config/config.py +0 -142

config/__init__.py DELETED Viewed

	@@ -1 +0,0 @@
1	- # Config Package

config/config.py DELETED Viewed

@@ -1,142 +0,0 @@
-# RAG Configuration File
-# Update these settings as needed
-import os
-from dotenv import load_dotenv
-# Load environment variables from .env file
-load_dotenv()
-# Common LLM Settings
-MAX_TOKENS = 1200
-TEMPERATURE = 0.4
-# OCR Settings
-OCR_SPACE_API_KEY = os.getenv("OCR_SPACE_API_KEY", "")
-# OpenAI Settings
-OPENAI_API_KEY = os.getenv("OPENAI_API_KEY", "")
-OPENAI_MODEL = "gpt-3.5-turbo"
-# Gemini Settings
-GEMINI_API_KEY = os.getenv("GEMINI_API_KEY", "")
-GEMINI_MODEL = "gemini-1.5-flash"
-# Groq Settings
-GROQ_API_KEY = os.getenv("GROQ_API_KEY")
-GROQ_MODEL = os.getenv("GROQ_MODEL", "llama3-70b-8192")
-GROQ_API_KEY_LITE = os.getenv("GROQ_API_KEY_LITE")
-GROQ_MODEL_LITE = "llama3-8b-8192"
-# API Authentication
-BEARER_TOKEN = os.getenv("BEARER_TOKEN", "c6cee5b5046310e401632a7effe9c684d071a9ef5ce09b96c9ec5c3ebd13085e")
-# Chunking (TOKEN-BASED)
-CHUNK_SIZE = 1600  # Maximum tokens per chunk (optimal for most LLMs)
-CHUNK_OVERLAP = 300  # Token overlap between chunks (reduced for efficiency)
-# Retrieval Settings
-TOP_K = 12
-SCORE_THRESHOLD = 0.3
-RERANK_TOP_K = 9
-BM25_WEIGHT = 0.3
-SEMANTIC_WEIGHT = 0.7
-# Advanced RAG Settings
-ENABLE_RERANKING = True
-ENABLE_HYBRID_SEARCH = True
-ENABLE_QUERY_EXPANSION = True
-RERANKER_MODEL = "cross-encoder/ms-marco-MiniLM-L-6-v2"
-QUERY_EXPANSION_COUNT = 3
-MAX_CONTEXT_LENGTH = 15000
-USE_TOTAL_BUDGET_APPROACH = True
-# Embedding Settings
-EMBEDDING_MODEL = "BAAI/bge-large-en"  # Optimal for CPU
-BATCH_SIZE = 32  # Increased for better CPU utilization (adjust based on RAM)
-# Paths
-OUTPUT_DIR = os.getenv("RAG_EMBEDDINGS_PATH", "./RAG/rag_embeddings")
-# API Settings
-API_HOST = "0.0.0.0"
-API_PORT = 8000
-API_RELOAD = True
-# Multi-LLM failover system
-sequence = ["primary", "secondary", "ternary", "quaternary", "quinary", "senary", "septenary", "octonary", "nonary", "denary"]
-def get_provider_configs():
-    """
-    Get configurations for all provider instances with failover support.
-    Supports multiple instances of each provider type for reliability.
-    """
-    configs = {
-        "groq": [],
-        "gemini": [],
-        "openai": []
-    }
-    # Groq configurations with multiple API keys for failover
-    DEFAULT_GROQ_MODEL = "qwen/qwen3-32b"
-    configs["groq"] = [{
-        "name": sequence[i-1],
-        "api_key": os.getenv(f"GROQ_API_KEY_{i}"),
-        "model": os.getenv(f"GROQ_MODEL_{i}", DEFAULT_GROQ_MODEL)} for i in range(1, 10) if os.getenv(f"GROQ_API_KEY_{i}", "")
-    ]
-    # Add main GROQ key as primary
-    if os.getenv("GROQ_API_KEY"):
-        configs["groq"].insert(0, {
-            "name": "main",
-            "api_key": os.getenv("GROQ_API_KEY"),
-            "model": DEFAULT_GROQ_MODEL
-        })
-    # Gemini configurations with multiple API keys for failover
-    DEFAULT_GEMINI_MODEL = "gemini-1.5-flash"
-    configs["gemini"] = [{
-            "name": sequence[i-1],
-            "api_key": os.getenv(f"GEMINI_API_KEY_{i}"),
-            "model": os.getenv(f"GEMINI_MODEL_{i}", DEFAULT_GEMINI_MODEL)
-        } for i in range(1, 10) if os.getenv(f"GEMINI_API_KEY_{i}", "")
-    ]
-    # Add main GEMINI key as primary
-    if os.getenv("GEMINI_API_KEY"):
-        configs["gemini"].insert(0, {
-            "name": "main",
-            "api_key": os.getenv("GEMINI_API_KEY"),
-            "model": DEFAULT_GEMINI_MODEL
-        })
-    # OpenAI configurations with multiple API keys for failover
-    DEFAULT_OPENAI_MODEL = "gpt-4o-mini"
-    configs["openai"] = [{
-            "name": sequence[i-1],
-            "api_key": os.getenv(f"OPENAI_API_KEY_{i}"),
-            "model": os.getenv(f"OPENAI_MODEL_{i}", DEFAULT_OPENAI_MODEL)
-        } for i in range(1, 10) if os.getenv(f"OPENAI_API_KEY_{i}", "")
-    ]
-    # Add main OPENAI key as primary
-    if os.getenv("OPENAI_API_KEY"):
-        configs["openai"].insert(0, {
-            "name": "main",
-            "api_key": os.getenv("OPENAI_API_KEY"),
-            "model": DEFAULT_OPENAI_MODEL
-        })
-    return configs
-# Specialized API keys for different tasks
-GROQ_API_KEY_TABULAR = os.getenv("GROQ_API_KEY_TABULAR", GROQ_API_KEY)
-GEMINI_API_KEY_IMAGE = os.getenv("GEMINI_API_KEY_IMAGE", GEMINI_API_KEY)
-GEMINI_API_KEY_MULTILINGUAL = os.getenv("GEMINI_API_KEY_MULTILINGUAL", GEMINI_API_KEY)
-# Validation (optional - comment out for production)
-# assert OPENAI_API_KEY, "OPENAI KEY NOT SET"
-# assert GEMINI_API_KEY, "GEMINI KEY NOT SET"
-# assert GROQ_API_KEY, "GROQ KEY NOT SET"