rag_chat_with_analytics

Sleeping

App Files Files Community

pvanand commited on Jan 15

Commit

dcb9038

verified ·

1 Parent(s): b310792

Update observability.py

Browse files

Files changed (1) hide show

observability.py +202 -141

observability.py CHANGED Viewed

@@ -121,151 +121,212 @@ class LLMObservabilityManager:
         Returns:
             Dict containing dashboard statistics and time series data
         """
-        def calculate_percentage_change(old_value: float, new_value: float) -> float:
-            """Calculate percentage change between two values."""
-            if old_value == 0:
-                return 100 if new_value > 0 else 0
-            return round(((new_value - old_value) / old_value) * 100, 2)
-        with sqlite3.connect(self.db_path) as conn:
-            cursor = conn.cursor()
-            # Build time filter
-            time_filter = ""
-            if days is not None:
-                time_filter = f"WHERE created_at >= datetime('now', '-{days} days')"
-            # Get general statistics
-            cursor.execute(f"""
-                SELECT
-                    COUNT(*) as total_requests,
-                    COUNT(DISTINCT conversation_id) as unique_conversations,
-                    COUNT(DISTINCT user) as unique_users,
-                    SUM(total_tokens) as total_tokens,
-                    SUM(cost) as total_cost,
-                    AVG(latency) as avg_latency,
-                    SUM(CASE WHEN status = 'error' THEN 1 ELSE 0 END) as error_count
-                FROM llm_observations
-                {time_filter}
-            """)
-            general_stats = dict(zip([col[0] for col in cursor.description], cursor.fetchone()))
-            # Get model distribution
-            cursor.execute(f"""
-                SELECT model, COUNT(*) as count
-                FROM llm_observations
-                {time_filter}
-                GROUP BY model
-                ORDER BY count DESC
-            """)
-            model_distribution = {row[0]: row[1] for row in cursor.fetchall()}
-            # Get average tokens per request
-            cursor.execute(f"""
-                SELECT
-                    AVG(prompt_tokens) as avg_prompt_tokens,
-                    AVG(completion_tokens) as avg_completion_tokens
-                FROM llm_observations
-                {time_filter}
-            """)
-            token_averages = dict(zip([col[0] for col in cursor.description], cursor.fetchone()))
-            # Get top users by request count
-            cursor.execute(f"""
-                SELECT user, COUNT(*) as request_count,
-                       SUM(total_tokens) as total_tokens,
-                       SUM(cost) as total_cost
-                FROM llm_observations
-                {time_filter}
-                GROUP BY user
-                ORDER BY request_count DESC
-                LIMIT 5
-            """)
-            top_users = [
-                {
-                    "user": row[0],
-                    "request_count": row[1],
-                    "total_tokens": row[2],
-                    "total_cost": round(row[3], 2)
-                }
-                for row in cursor.fetchall()
-            ]
-            # Get time series data
-            time_series_format = {
-                'hour': "%Y-%m-%d %H:00:00",
-                'day': "%Y-%m-%d",
-                'week': "%Y-%W",
-                'month': "%Y-%m"
-            }
-            format_string = time_series_format[time_series_interval]
-            cursor.execute(f"""
-                SELECT
-                    strftime('{format_string}', created_at) as time_bucket,
-                    COUNT(*) as request_count,
-                    SUM(total_tokens) as total_tokens,
-                    SUM(cost) as total_cost,
-                    AVG(latency) as avg_latency,
-                    COUNT(DISTINCT user) as unique_users,
-                    SUM(CASE WHEN status = 'error' THEN 1 ELSE 0 END) as error_count
-                FROM llm_observations
-                {time_filter}
-                GROUP BY time_bucket
-                ORDER BY time_bucket
-            """)
-            time_series = [
-                {
-                    "timestamp": row[0],
-                    "request_count": row[1],
-                    "total_tokens": row[2],
-                    "total_cost": round(row[3], 2),
-                    "avg_latency": round(row[4], 2),
-                    "unique_users": row[5],
-                    "error_count": row[6]
-                }
-                for row in cursor.fetchall()
-            ]
-            # Calculate usage trends (percentage change)
-            if len(time_series) >= 2:
-                current = time_series[-1]
-                previous = time_series[-2]
-                trends = {
-                    "request_trend": calculate_percentage_change(
-                        previous["request_count"], current["request_count"]),
-                    "cost_trend": calculate_percentage_change(
-                        previous["total_cost"], current["total_cost"]),
-                    "token_trend": calculate_percentage_change(
-                        previous["total_tokens"], current["total_tokens"])
                 }
-            else:
-                trends = {
-                    "request_trend": 0,
-                    "cost_trend": 0,
-                    "token_trend": 0
                 }
             return {
-                "general_stats": {
-                    "total_requests": general_stats["total_requests"],
-                    "unique_conversations": general_stats["unique_conversations"],
-                    "unique_users": general_stats["unique_users"],
-                    "total_tokens": general_stats["total_tokens"],
-                    "total_cost": round(general_stats["total_cost"], 2),
-                    "avg_latency": round(general_stats["avg_latency"], 2),
-                    "error_rate": round(general_stats["error_count"] / general_stats["total_requests"] * 100, 2)
-                },
-                "model_distribution": model_distribution,
-                "token_metrics": {
-                    "avg_prompt_tokens": round(token_averages["avg_prompt_tokens"], 2),
-                    "avg_completion_tokens": round(token_averages["avg_completion_tokens"], 2)
-                },
-                "top_users": top_users,
-                "time_series": time_series,
-                "trends": trends
             }

         Returns:
             Dict containing dashboard statistics and time series data
         """
+        def safe_round(value: Any, decimals: int = 2) -> float:
+            """Safely round a value, returning 0 if the value is None or invalid."""
+            try:
+                return round(float(value), decimals) if value is not None else 0.0
+            except (TypeError, ValueError):
+                return 0.0
+        def safe_divide(numerator: Any, denominator: Any, decimals: int = 2) -> float:
+            """Safely divide two numbers, handling None and zero division."""
+            try:
+                if not denominator or denominator is None:
+                    return 0.0
+                return round(float(numerator or 0) / float(denominator), decimals)
+            except (TypeError, ValueError):
+                return 0.0
+        try:
+            with sqlite3.connect(self.db_path) as conn:
+                cursor = conn.cursor()
+                # Build time filter
+                time_filter = ""
+                if days is not None:
+                    time_filter = f"WHERE created_at >= datetime('now', '-{days} days')"
+                # Get general statistics
+                cursor.execute(f"""
+                    SELECT
+                        COUNT(*) as total_requests,
+                        COUNT(DISTINCT conversation_id) as unique_conversations,
+                        COUNT(DISTINCT user) as unique_users,
+                        SUM(total_tokens) as total_tokens,
+                        SUM(cost) as total_cost,
+                        AVG(latency) as avg_latency,
+                        SUM(CASE WHEN status = 'error' THEN 1 ELSE 0 END) as error_count
+                    FROM llm_observations
+                    {time_filter}
+                """)
+                row = cursor.fetchone()
+                if not row:
+                    return self._get_empty_statistics()
+                general_stats = dict(zip([col[0] for col in cursor.description], row))
+                # Get model distribution
+                cursor.execute(f"""
+                    SELECT model, COUNT(*) as count
+                    FROM llm_observations
+                    {time_filter}
+                    GROUP BY model
+                    ORDER BY count DESC
+                """)
+                model_distribution = {row[0]: row[1] for row in cursor.fetchall()} if cursor.fetchall() else {}
+                # Get average tokens per request
+                cursor.execute(f"""
+                    SELECT
+                        AVG(prompt_tokens) as avg_prompt_tokens,
+                        AVG(completion_tokens) as avg_completion_tokens
+                    FROM llm_observations
+                    {time_filter}
+                """)
+                token_averages = dict(zip([col[0] for col in cursor.description], cursor.fetchone()))
+                # Get top users by request count
+                cursor.execute(f"""
+                    SELECT user, COUNT(*) as request_count,
+                           SUM(total_tokens) as total_tokens,
+                           SUM(cost) as total_cost
+                    FROM llm_observations
+                    {time_filter}
+                    GROUP BY user
+                    ORDER BY request_count DESC
+                    LIMIT 5
+                """)
+                top_users = [
+                    {
+                        "user": row[0],
+                        "request_count": row[1],
+                        "total_tokens": row[2] or 0,
+                        "total_cost": safe_round(row[3])
+                    }
+                    for row in cursor.fetchall()
+                ]
+                # Get time series data
+                time_series_format = {
+                    'hour': "%Y-%m-%d %H:00:00",
+                    'day': "%Y-%m-%d",
+                    'week': "%Y-%W",
+                    'month': "%Y-%m"
                 }
+                format_string = time_series_format.get(time_series_interval, "%Y-%m-%d")
+                cursor.execute(f"""
+                    SELECT
+                        strftime('{format_string}', created_at) as time_bucket,
+                        COUNT(*) as request_count,
+                        SUM(total_tokens) as total_tokens,
+                        SUM(cost) as total_cost,
+                        AVG(latency) as avg_latency,
+                        COUNT(DISTINCT user) as unique_users,
+                        SUM(CASE WHEN status = 'error' THEN 1 ELSE 0 END) as error_count
+                    FROM llm_observations
+                    {time_filter}
+                    GROUP BY time_bucket
+                    ORDER BY time_bucket
+                """)
+                time_series = [
+                    {
+                        "timestamp": row[0],
+                        "request_count": row[1] or 0,
+                        "total_tokens": row[2] or 0,
+                        "total_cost": safe_round(row[3]),
+                        "avg_latency": safe_round(row[4]),
+                        "unique_users": row[5] or 0,
+                        "error_count": row[6] or 0
+                    }
+                    for row in cursor.fetchall()
+                ]
+                # Calculate trends safely
+                trends = self._calculate_trends(time_series)
+                return {
+                    "general_stats": {
+                        "total_requests": general_stats["total_requests"] or 0,
+                        "unique_conversations": general_stats["unique_conversations"] or 0,
+                        "unique_users": general_stats["unique_users"] or 0,
+                        "total_tokens": general_stats["total_tokens"] or 0,
+                        "total_cost": safe_round(general_stats["total_cost"]),
+                        "avg_latency": safe_round(general_stats["avg_latency"]),
+                        "error_rate": safe_round(
+                            safe_divide(general_stats["error_count"], general_stats["total_requests"]) * 100
+                        )
+                    },
+                    "model_distribution": model_distribution,
+                    "token_metrics": {
+                        "avg_prompt_tokens": safe_round(token_averages["avg_prompt_tokens"]),
+                        "avg_completion_tokens": safe_round(token_averages["avg_completion_tokens"])
+                    },
+                    "top_users": top_users,
+                    "time_series": time_series,
+                    "trends": trends
                 }
+        except sqlite3.Error as e:
+            logger.error(f"Database error in get_dashboard_statistics: {e}")
+            return self._get_empty_statistics()
+        except Exception as e:
+            logger.error(f"Error in get_dashboard_statistics: {e}")
+            return self._get_empty_statistics()
+    def _get_empty_statistics(self) -> Dict[str, Any]:
+        """Return an empty statistics structure when no data is available."""
+        return {
+            "general_stats": {
+                "total_requests": 0,
+                "unique_conversations": 0,
+                "unique_users": 0,
+                "total_tokens": 0,
+                "total_cost": 0.0,
+                "avg_latency": 0.0,
+                "error_rate": 0.0
+            },
+            "model_distribution": {},
+            "token_metrics": {
+                "avg_prompt_tokens": 0.0,
+                "avg_completion_tokens": 0.0
+            },
+            "top_users": [],
+            "time_series": [],
+            "trends": {
+                "request_trend": 0.0,
+                "cost_trend": 0.0,
+                "token_trend": 0.0
+            }
+        }
+    def _calculate_trends(self, time_series: List[Dict[str, Any]]) -> Dict[str, float]:
+        """Calculate trends safely from time series data."""
+        if len(time_series) >= 2:
+            current = time_series[-1]
+            previous = time_series[-2]
             return {
+                "request_trend": self._calculate_percentage_change(
+                    previous["request_count"], current["request_count"]),
+                "cost_trend": self._calculate_percentage_change(
+                    previous["total_cost"], current["total_cost"]),
+                "token_trend": self._calculate_percentage_change(
+                    previous["total_tokens"], current["total_tokens"])
             }
+        return {
+            "request_trend": 0.0,
+            "cost_trend": 0.0,
+            "token_trend": 0.0
+        }
+    def _calculate_percentage_change(self, old_value: Any, new_value: Any) -> float:
+        """Calculate percentage change between two values safely."""
+        try:
+            old_value = float(old_value or 0)
+            new_value = float(new_value or 0)
+            if old_value == 0:
+                return 100.0 if new_value > 0 else 0.0
+            return round(((new_value - old_value) / old_value) * 100, 2)
+        except (TypeError, ValueError):
+            return 0.0