Spaces:

UcsTurkey
/

flare

Building

App Files Files Community

ciyidogan commited on 27 days ago

Commit

2d2ab61

verified ·

1 Parent(s): 394611c

Update llm_interface.py

Browse files

Files changed (1) hide show

llm_interface.py +29 -59

llm_interface.py CHANGED Viewed

@@ -12,7 +12,7 @@ class LLMInterface(ABC):
     """Abstract base class for LLM providers"""
     def __init__(self, settings: Dict[str, Any] = None):
-        """Initialize with provider-specific settings"""
         self.settings = settings or {}
         self.internal_prompt = self.settings.get("internal_prompt", "")
         self.parameter_collection_config = self.settings.get("parameter_collection_config", {})
@@ -28,23 +28,22 @@ class LLMInterface(ABC):
         pass
 class SparkLLM(LLMInterface):
-    """Spark LLM integration"""
-    def __init__(self, spark_endpoint: str, spark_token: str, provider_variant: str = "spark", settings: Dict = None):
         super().__init__(settings)
         self.spark_endpoint = spark_endpoint.rstrip("/")
         self.spark_token = spark_token
         self.provider_variant = provider_variant
-        log(f"🔌 SparkLLM initialized with endpoint: {self.spark_endpoint}, variant: {self.provider_variant}")
     async def generate(self, system_prompt: str, user_input: str, context: List[Dict]) -> str:
-        """Generate response from Spark"""
         headers = {
             "Authorization": f"Bearer {self.spark_token}",
             "Content-Type": "application/json"
         }
-        # Build payload
         payload = {
             "system_prompt": system_prompt,
             "user_input": user_input,
@@ -52,7 +51,6 @@ class SparkLLM(LLMInterface):
         }
         try:
-            log(f"📤 Spark request to {self.spark_endpoint}/generate")
             async with httpx.AsyncClient(timeout=60) as client:
                 response = await client.post(
                     f"{self.spark_endpoint}/generate",
@@ -68,68 +66,47 @@ class SparkLLM(LLMInterface):
                     raw = (data.get("assistant") or data.get("text", "")).strip()
                 return raw
-        except httpx.TimeoutException:
-            log("⏱️ Spark timeout")
-            raise
         except Exception as e:
             log(f"❌ Spark error: {e}")
             raise
     async def startup(self, project_config: Dict) -> bool:
         """Send startup request to Spark"""
-        headers = {
-            "Authorization": f"Bearer {self.spark_token}",
-            "Content-Type": "application/json"
-        }
-        try:
-            log(f"🚀 Sending startup to Spark for project: {project_config.get('project_name')}")
-            async with httpx.AsyncClient(timeout=30) as client:
-                response = await client.post(
-                    f"{self.spark_endpoint}/startup",
-                    json=project_config,
-                    headers=headers
-                )
-                response.raise_for_status()
-                log("✅ Spark startup successful")
-                return True
-        except Exception as e:
-            log(f"❌ Spark startup failed: {e}")
-            return False
 class GPT4oLLM(LLMInterface):
     """OpenAI GPT integration"""
-    def __init__(self, api_key: str, model: str = "gpt-4o-mini", settings: Dict = None):
         super().__init__(settings)
         self.api_key = api_key
         self.model = model
         self.client = AsyncOpenAI(api_key=api_key)
-        # Default GPT settings
-        self.temperature = settings.get("temperature", 0.3) if settings else 0.3
-        self.max_tokens = settings.get("max_tokens", 512) if settings else 512
         log(f"✅ Initialized GPT LLM with model: {model}")
     async def generate(self, system_prompt: str, user_input: str, context: List[Dict]) -> str:
-        """Generate response from GPT"""
         try:
-            # Convert context to OpenAI format
-            messages = []
-            # Add system prompt
-            messages.append({"role": "system", "content": system_prompt})
-            # Add conversation history
-            for msg in context[-10:]:  # Last 10 messages
-                role = "user" if msg["role"] == "user" else "assistant"
-                messages.append({"role": role, "content": msg["content"]})
             # Add current user input
             messages.append({"role": "user", "content": user_input})
-            log(f"📤 GPT request with {len(messages)} messages")
-            # Call OpenAI API
             response = await self.client.chat.completions.create(
                 model=self.model,
                 messages=messages,
@@ -137,26 +114,19 @@ class GPT4oLLM(LLMInterface):
                 max_tokens=self.max_tokens
             )
-            content = response.choices[0].message.content
-            log(f"✅ GPT response received: {len(content)} chars")
-            return content
         except Exception as e:
             log(f"❌ GPT error: {e}")
             raise
     async def startup(self, project_config: Dict) -> bool:
-        """GPT doesn't need startup - just validate API key"""
         try:
-            # Test API key with a minimal request
-            response = await self.client.chat.completions.create(
-                model=self.model,
-                messages=[{"role": "user", "content": "test"}],
-                max_tokens=5
-            )
-            log("✅ GPT API key validated")
             return True
         except Exception as e:
-            log(f"❌ GPT API key validation failed: {e}")
             return False

     """Abstract base class for LLM providers"""
     def __init__(self, settings: Dict[str, Any] = None):
+        """Initialize with settings"""
         self.settings = settings or {}
         self.internal_prompt = self.settings.get("internal_prompt", "")
         self.parameter_collection_config = self.settings.get("parameter_collection_config", {})
         pass
 class SparkLLM(LLMInterface):
+    """Spark integration for HuggingFace"""
+    def __init__(self, spark_endpoint: str, spark_token: str, provider_variant: str = "spark-cloud", settings: Dict[str, Any] = None):
         super().__init__(settings)
         self.spark_endpoint = spark_endpoint.rstrip("/")
         self.spark_token = spark_token
         self.provider_variant = provider_variant
+        log(f"🔌 SparkLLM initialized with endpoint: {self.spark_endpoint}")
     async def generate(self, system_prompt: str, user_input: str, context: List[Dict]) -> str:
+        """Generate response using Spark"""
         headers = {
             "Authorization": f"Bearer {self.spark_token}",
             "Content-Type": "application/json"
         }
         payload = {
             "system_prompt": system_prompt,
             "user_input": user_input,
         }
         try:
             async with httpx.AsyncClient(timeout=60) as client:
                 response = await client.post(
                     f"{self.spark_endpoint}/generate",
                     raw = (data.get("assistant") or data.get("text", "")).strip()
                 return raw
         except Exception as e:
             log(f"❌ Spark error: {e}")
             raise
     async def startup(self, project_config: Dict) -> bool:
         """Send startup request to Spark"""
+        # Implement if needed for Spark startup notification
+        return True
 class GPT4oLLM(LLMInterface):
     """OpenAI GPT integration"""
+    def __init__(self, api_key: str, model: str = "gpt-4o-mini", settings: Dict[str, Any] = None):
         super().__init__(settings)
         self.api_key = api_key
         self.model = model
         self.client = AsyncOpenAI(api_key=api_key)
+        # Extract settings
+        self.temperature = settings.get("temperature", 0.7) if settings else 0.7
+        self.max_tokens = settings.get("max_tokens", 4096) if settings else 4096
         log(f"✅ Initialized GPT LLM with model: {model}")
     async def generate(self, system_prompt: str, user_input: str, context: List[Dict]) -> str:
+        """Generate response using OpenAI GPT"""
         try:
+            # Build messages
+            messages = [{"role": "system", "content": system_prompt}]
+            # Add context
+            for msg in context:
+                messages.append({
+                    "role": msg.get("role", "user"),
+                    "content": msg.get("content", "")
+                })
             # Add current user input
             messages.append({"role": "user", "content": user_input})
+            # Generate response
             response = await self.client.chat.completions.create(
                 model=self.model,
                 messages=messages,
                 max_tokens=self.max_tokens
             )
+            return response.choices[0].message.content.strip()
         except Exception as e:
             log(f"❌ GPT error: {e}")
             raise
     async def startup(self, project_config: Dict) -> bool:
+        """Validate API key"""
         try:
+            # Test API key with a simple request
+            response = await self.client.models.list()
+            log(f"✅ OpenAI API key validated, available models: {len(response.data)}")
             return True
         except Exception as e:
+            log(f"❌ Invalid OpenAI API key: {e}")
             return False