Spaces:

rkihacker
/

AZAA

Running

App Files Files Community

rkihacker commited on May 21

Commit

06ea63c

verified ·

1 Parent(s): df657b2

Update main.py

Browse files

Files changed (1) hide show

main.py +11 -15

main.py CHANGED Viewed

@@ -56,28 +56,28 @@ def build_payload(chat: ChatRequest):
         "frequency_penalty": chat.frequency_penalty
     }
-# Streaming chunk handler with model replacement and UTF-8 fix
 def stream_generator(requested_model: str, payload: dict, headers: dict):
     with requests.post(API_URL, headers=headers, json=payload, stream=True) as r:
-        for line in r.iter_lines(decode_unicode=True):
             if not line:
                 continue
-            if line.startswith("data:"):
                 content = line[6:].strip()
-                if content == "[DONE]":
-                    yield "data: [DONE]\n\n"
                     continue
                 try:
-                    json_obj = json.loads(content)
                     if json_obj.get("model") == BACKEND_MODEL:
                         json_obj["model"] = requested_model
-                    yield "data: " + json.dumps(json_obj, ensure_ascii=False) + "\n\n"
                 except json.JSONDecodeError:
                     logger.warning("Invalid JSON in stream chunk: %s", content)
             else:
                 logger.debug("Non-data stream line skipped: %s", line)
-# Main API endpoint
 @app.post("/v1/chat/completions")
 async def proxy_chat(request: Request):
     try:
@@ -93,19 +93,15 @@ async def proxy_chat(request: Request):
         if chat_request.stream:
             return StreamingResponse(
                 stream_generator(chat_request.model, payload, headers),
-                media_type="text/event-stream; charset=utf-8",
-                headers={"Content-Type": "text/event-stream; charset=utf-8"}
             )
         else:
             response = requests.post(API_URL, headers=headers, json=payload)
             data = response.json()
             if "model" in data and data["model"] == BACKEND_MODEL:
                 data["model"] = chat_request.model
-            return JSONResponse(
-                content=data,
-                media_type="application/json; charset=utf-8",
-                headers={"Content-Type": "application/json; charset=utf-8"}
-            )
     except Exception as e:
         logger.error("Error in /v1/chat/completions: %s", str(e))

         "frequency_penalty": chat.frequency_penalty
     }
+# Stream generator without forcing UTF-8
 def stream_generator(requested_model: str, payload: dict, headers: dict):
     with requests.post(API_URL, headers=headers, json=payload, stream=True) as r:
+        for line in r.iter_lines(decode_unicode=False):  # Keep as bytes
             if not line:
                 continue
+            if line.startswith(b"data:"):
                 content = line[6:].strip()
+                if content == b"[DONE]":
+                    yield b"data: [DONE]\n\n"
                     continue
                 try:
+                    json_obj = json.loads(content.decode("utf-8"))
                     if json_obj.get("model") == BACKEND_MODEL:
                         json_obj["model"] = requested_model
+                    yield f"data: {json.dumps(json_obj)}\n\n".encode("utf-8")
                 except json.JSONDecodeError:
                     logger.warning("Invalid JSON in stream chunk: %s", content)
             else:
                 logger.debug("Non-data stream line skipped: %s", line)
+# Main endpoint
 @app.post("/v1/chat/completions")
 async def proxy_chat(request: Request):
     try:
         if chat_request.stream:
             return StreamingResponse(
                 stream_generator(chat_request.model, payload, headers),
+                media_type="text/event-stream"
             )
         else:
             response = requests.post(API_URL, headers=headers, json=payload)
+            response.raise_for_status()  # Raise error for bad responses
             data = response.json()
             if "model" in data and data["model"] == BACKEND_MODEL:
                 data["model"] = chat_request.model
+            return JSONResponse(content=data)
     except Exception as e:
         logger.error("Error in /v1/chat/completions: %s", str(e))