# File: llm_observability.py
import sqlite3
import json
from datetime import datetime
from typing import Dict, Any, List, Optional, Callable
import logging
import functools

logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
logger = logging.getLogger(__name__)

def log_execution(func: Callable) -> Callable:
    @functools.wraps(func)
    def wrapper(*args: Any, **kwargs: Any) -> Any:
        logger.info(f"Executing {func.__name__}")
        try:
            result = func(*args, **kwargs)
            logger.info(f"{func.__name__} completed successfully")
            return result
        except Exception as e:
            logger.error(f"Error in {func.__name__}: {e}")
            raise
    return wrapper


class LLMObservabilityManager:
    def __init__(self, db_path: str = "/data/llm_observability_v2.db"):
        self.db_path = db_path
        self.create_table()

    def create_table(self):
        with sqlite3.connect(self.db_path) as conn:
            cursor = conn.cursor()
            cursor.execute('''
                CREATE TABLE IF NOT EXISTS llm_observations (
                    id INTEGER PRIMARY KEY AUTOINCREMENT,
                    conversation_id TEXT,
                    created_at DATETIME,
                    status TEXT,
                    request TEXT,
                    response TEXT,
                    model TEXT,
                    prompt_tokens INTEGER,
                    completion_tokens INTEGER,
                    total_tokens INTEGER,
                    cost FLOAT,
                    latency FLOAT,
                    user TEXT
                )
            ''')

    def insert_observation(self, response: str, conversation_id: str, status: str, request: str, model: str, prompt_tokens: int,completion_tokens: int, total_tokens: int, cost: float, latency: float, user: str):
        created_at = datetime.now()
        
        with sqlite3.connect(self.db_path) as conn:
            cursor = conn.cursor()
            cursor.execute('''
                INSERT INTO llm_observations 
                (conversation_id, created_at, status, request, response, model, prompt_tokens, completion_tokens,total_tokens, cost, latency, user)
                VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?)
            ''', (
                conversation_id,
                created_at,
                status,
                request,
                response,
                model,
                prompt_tokens,
                completion_tokens,
                total_tokens,
                cost,
                latency,
                user
            ))

    def get_observations(self, conversation_id: Optional[str] = None) -> List[Dict[str, Any]]:
        with sqlite3.connect(self.db_path) as conn:
            cursor = conn.cursor()
            if conversation_id:
                cursor.execute('SELECT * FROM llm_observations WHERE conversation_id = ? ORDER BY created_at', (conversation_id,))
            else:
                cursor.execute('SELECT * FROM llm_observations ORDER BY created_at')
            rows = cursor.fetchall()

            column_names = [description[0] for description in cursor.description]
            return [dict(zip(column_names, row)) for row in rows]

    def get_all_observations(self) -> List[Dict[str, Any]]:
        return self.get_observations()
    
    def get_all_unique_conversation_observations(self, limit: Optional[int] = None) -> List[Dict[str, Any]]:
        with sqlite3.connect(self.db_path) as conn:
            cursor = conn.cursor()
            # Get the latest observation for each unique conversation_id
            query = '''
                SELECT * FROM llm_observations o1
                WHERE created_at = (
                    SELECT MAX(created_at) 
                    FROM llm_observations o2 
                    WHERE o2.conversation_id = o1.conversation_id
                )
                ORDER BY created_at DESC
            '''
            if limit is not None:
                query += f' LIMIT {limit}'
                
            cursor.execute(query)
            rows = cursor.fetchall()
            
            column_names = [description[0] for description in cursor.description]
            return [dict(zip(column_names, row)) for row in rows]

    def get_dashboard_statistics(self, days: Optional[int] = None, time_series_interval: str = 'day') -> Dict[str, Any]:
        """
        Get statistical metrics for LLM usage dashboard with time series data.
        
        Args:
            days (int, optional): Number of days to look back. If None, returns all-time statistics
            time_series_interval (str): Interval for time series data ('hour', 'day', 'week', 'month')
            
        Returns:
            Dict containing dashboard statistics and time series data
        """
        with sqlite3.connect(self.db_path) as conn:
            cursor = conn.cursor()
            
            # Build time filter
            time_filter = ""
            if days is not None:
                time_filter = f"WHERE created_at >= datetime('now', '-{days} days')"
            
            # Get general statistics
            cursor.execute(f"""
                SELECT 
                    COUNT(*) as total_requests,
                    COUNT(DISTINCT conversation_id) as unique_conversations,
                    COUNT(DISTINCT user) as unique_users,
                    SUM(total_tokens) as total_tokens,
                    SUM(cost) as total_cost,
                    AVG(latency) as avg_latency,
                    SUM(CASE WHEN status = 'error' THEN 1 ELSE 0 END) as error_count
                FROM llm_observations
                {time_filter}
            """)
            general_stats = dict(zip([col[0] for col in cursor.description], cursor.fetchone()))
            
            # Get model distribution
            cursor.execute(f"""
                SELECT model, COUNT(*) as count
                FROM llm_observations
                {time_filter}
                GROUP BY model
                ORDER BY count DESC
            """)
            model_distribution = {row[0]: row[1] for row in cursor.fetchall()}
            
            # Get average tokens per request
            cursor.execute(f"""
                SELECT 
                    AVG(prompt_tokens) as avg_prompt_tokens,
                    AVG(completion_tokens) as avg_completion_tokens
                FROM llm_observations
                {time_filter}
            """)
            token_averages = dict(zip([col[0] for col in cursor.description], cursor.fetchone()))
            
            # Get top users by request count
            cursor.execute(f"""
                SELECT user, COUNT(*) as request_count, 
                       SUM(total_tokens) as total_tokens,
                       SUM(cost) as total_cost
                FROM llm_observations
                {time_filter}
                GROUP BY user
                ORDER BY request_count DESC
                LIMIT 5
            """)
            top_users = [
                {
                    "user": row[0],
                    "request_count": row[1],
                    "total_tokens": row[2],
                    "total_cost": round(row[3], 2)
                }
                for row in cursor.fetchall()
            ]
    
            # Get time series data
            time_series_format = {
                'hour': "%Y-%m-%d %H:00:00",
                'day': "%Y-%m-%d",
                'week': "%Y-%W",
                'month': "%Y-%m"
            }
            
            format_string = time_series_format[time_series_interval]
            
            cursor.execute(f"""
                SELECT 
                    strftime('{format_string}', created_at) as time_bucket,
                    COUNT(*) as request_count,
                    SUM(total_tokens) as total_tokens,
                    SUM(cost) as total_cost,
                    AVG(latency) as avg_latency,
                    COUNT(DISTINCT user) as unique_users,
                    SUM(CASE WHEN status = 'error' THEN 1 ELSE 0 END) as error_count
                FROM llm_observations
                {time_filter}
                GROUP BY time_bucket
                ORDER BY time_bucket
            """)
            
            time_series = [
                {
                    "timestamp": row[0],
                    "request_count": row[1],
                    "total_tokens": row[2],
                    "total_cost": round(row[3], 2),
                    "avg_latency": round(row[4], 2),
                    "unique_users": row[5],
                    "error_count": row[6]
                }
                for row in cursor.fetchall()
            ]
    
            # Calculate usage trends (percentage change)
            if len(time_series) >= 2:
                current = time_series[-1]
                previous = time_series[-2]
                trends = {
                    "request_trend": calculate_percentage_change(
                        previous["request_count"], current["request_count"]),
                    "cost_trend": calculate_percentage_change(
                        previous["total_cost"], current["total_cost"]),
                    "token_trend": calculate_percentage_change(
                        previous["total_tokens"], current["total_tokens"])
                }
            else:
                trends = {
                    "request_trend": 0,
                    "cost_trend": 0,
                    "token_trend": 0
                }
    
            return {
                "general_stats": {
                    "total_requests": general_stats["total_requests"],
                    "unique_conversations": general_stats["unique_conversations"],
                    "unique_users": general_stats["unique_users"],
                    "total_tokens": general_stats["total_tokens"],
                    "total_cost": round(general_stats["total_cost"], 2),
                    "avg_latency": round(general_stats["avg_latency"], 2),
                    "error_rate": round(general_stats["error_count"] / general_stats["total_requests"] * 100, 2)
                },
                "model_distribution": model_distribution,
                "token_metrics": {
                    "avg_prompt_tokens": round(token_averages["avg_prompt_tokens"], 2),
                    "avg_completion_tokens": round(token_averages["avg_completion_tokens"], 2)
                },
                "top_users": top_users,
                "time_series": time_series,
                "trends": trends
            }
    
    def calculate_percentage_change(old_value: float, new_value: float) -> float:
        """Calculate percentage change between two values."""
        if old_value == 0:
            return 100 if new_value > 0 else 0
        return round(((new_value - old_value) / old_value) * 100, 2)