test24

Sleeping

File size: 8,415 Bytes

922e6b4
f48dc4d
58c2f0c
69e4e8b
 
 
922e6b4
f894e42
ed5df64
f894e42
69e4e8b
 
 
 
 
 
 
caad10a
69e4e8b
58c2f0c
 
922e6b4
f48dc4d
ed5df64
 
f48dc4d
7ac3054
f48dc4d
c0e5311
f48dc4d
 
 
 
 
 
 
 
 
c0e5311
f48dc4d
 
 
 
 
 
69e4e8b
 
 
 
 
f48dc4d
 
69e4e8b
f48dc4d
011db4b
f48dc4d
69e4e8b
f48dc4d
 
69e4e8b
 
 
 
 
 
 
 
caad10a
 
 
ed5df64
f894e42
8ac4bd6
cbf97c0
ed5df64
 
 
69e4e8b
 
 
 
 
922e6b4
ed5df64
69e4e8b
 
 
8ac4bd6
69e4e8b
011db4b
f48dc4d
69e4e8b
 
 
 
9dd902e
69e4e8b
 
9dd902e
 
69e4e8b
 
7ac3054
69e4e8b
 
 
 
 
 
 
9dd902e
f48dc4d
 
 
 
 
 
 
69e4e8b
f48dc4d
 
 
 
 
c0e5311
f48dc4d
69e4e8b
7875e72
69e4e8b
 
 
c0e5311
011db4b
f48dc4d
 
8ac4bd6
f48dc4d
 
8ac4bd6
f48dc4d
 
ed5df64
f894e42
8ac4bd6
69e4e8b
ed5df64
 
 
69e4e8b
 
 
 
 
 
f894e42
69e4e8b
 
 
8ac4bd6
69e4e8b
 
95050a6
69e4e8b
 
 
 
9dd902e
69e4e8b
 
9dd902e
 
69e4e8b
 
7ac3054
69e4e8b
 
 
 
 
 
 
9dd902e
95050a6
69e4e8b
95050a6
 
69e4e8b
 
 
 
 
 
 
 
8ac4bd6
69e4e8b
 
8ac4bd6
69e4e8b
95050a6
 
69e4e8b
 
 
95050a6
 
 
 
011db4b
95050a6
 
 
69e4e8b
95050a6

from datetime import datetime
import json
import uuid
import asyncio
import random
from typing import Any, Dict, Optional
import httpx
from fastapi import HTTPException, Request
from dotenv import load_dotenv
from api import validate
from api.config import (
    MODEL_MAPPING,
    get_headers_api_chat,
    get_headers_chat,
    BASE_URL,
    AGENT_MODE,
    TRENDING_AGENT_MODE,
    MODEL_PREFIXES
)
from api.models import ChatRequest
from api.logger import setup_logger
from api.rpmlimits import check_rate_limit, get_client_ip  # Import rate limit functions

# Initialize environment variables and logger
load_dotenv()
logger = setup_logger(__name__)

def create_chat_completion_data(
    content: str, model: str, timestamp: int, finish_reason: Optional[str] = None
) -> Dict[str, Any]:
    return {
        "id": f"chatcmpl-{uuid.uuid4()}",
        "object": "chat.completion.chunk",
        "created": timestamp,
        "model": model,
        "choices": [
            {
                "index": 0,
                "delta": {"content": content, "role": "assistant"},
                "finish_reason": finish_reason,
            }
        ],
        "usage": None,
    }

def message_to_dict(message, model_prefix: Optional[str] = None):
    content = message.content if isinstance(message.content, str) else message.content[0]["text"]
    if model_prefix:
        content = f"{model_prefix} {content}"
    if isinstance(message.content, list) and len(message.content) == 2 and "image_url" in message.content[1]:
        return {
            "role": message.role,
            "content": content,
            "data": {
                "imageBase64": message.content[1]["image_url"]["url"],
                "fileText": "",
                "title": "snapshot",
            },
        }
    return {"role": message.role, "content": content}

def strip_model_prefix(content: str, model_prefix: Optional[str] = None) -> str:
    if model_prefix and content.startswith(model_prefix):
        logger.debug(f"Stripping prefix '{model_prefix}' from content.")
        return content[len(model_prefix):].strip()
    return content

def get_referer_url() -> str:
    return BASE_URL

async def process_streaming_response(request: ChatRequest, request_obj: Request):
    referer_url = get_referer_url()
    logger.info(f"Processing streaming response - Model: {request.model} - URL: {referer_url}")

    client_ip = get_client_ip(request_obj)
    check_rate_limit(client_ip)

    agent_mode = AGENT_MODE.get(request.model, {})
    trending_agent_mode = TRENDING_AGENT_MODE.get(request.model, {})
    model_prefix = MODEL_PREFIXES.get(request.model, "")

    headers_api_chat = get_headers_api_chat(referer_url)
    validated_token = validate.getHid()
    logger.info(f"Retrieved validated token for IP {client_ip}: {validated_token}")

    if request.model == 'o1-preview':
        delay_seconds = random.randint(1, 60)
        logger.info(f"Introducing a delay of {delay_seconds} seconds for model 'o1-preview'")
        await asyncio.sleep(delay_seconds)

    json_data = {
        "agentMode": agent_mode,
        "clickedAnswer2": False,
        "clickedAnswer3": False,
        "clickedForceWebSearch": False,
        "codeModelMode": True,
        "githubToken": None,
        "isChromeExt": False,
        "isMicMode": False,
        "maxTokens": request.max_tokens,
        "messages": [message_to_dict(msg, model_prefix=model_prefix) for msg in request.messages],
        "mobileClient": False,
        "playgroundTemperature": request.temperature,
        "playgroundTopP": request.top_p,
        "previewToken": None,
        "trendingAgentMode": trending_agent_mode,
        "userId": None,
        "userSelectedModel": MODEL_MAPPING.get(request.model, request.model),
        "userSystemPrompt": None,
        "validated": validated_token,
        "visitFromDelta": False,
    }

    async with httpx.AsyncClient() as client:
        try:
            async with client.stream(
                "POST",
                f"{BASE_URL}/api/chat",
                headers=headers_api_chat,
                json=json_data,
                timeout=100,
            ) as response:
                response.raise_for_status()
                async for line in response.aiter_lines():
                    timestamp = int(datetime.now().timestamp())
                    if line:
                        content = line
                        if content.startswith("$@$v=undefined-rv1$@$"):
                            content = content[21:]
                        cleaned_content = strip_model_prefix(content, model_prefix)
                        yield f"data: {json.dumps(create_chat_completion_data(cleaned_content, request.model, timestamp))}\n\n"

                yield f"data: {json.dumps(create_chat_completion_data('', request.model, timestamp, 'stop'))}\n\n"
                yield "data: [DONE]\n\n"
        except httpx.HTTPStatusError as e:
            logger.error(f"HTTP error occurred (IP: {client_ip}): {e}")
            raise HTTPException(status_code=e.response.status_code, detail=str(e))
        except httpx.RequestError as e:
            logger.error(f"Error occurred during request (IP: {client_ip}): {e}")
            raise HTTPException(status_code=500, detail=str(e))

async def process_non_streaming_response(request: ChatRequest, request_obj: Request):
    referer_url = get_referer_url()
    logger.info(f"Processing non-streaming response - Model: {request.model} - URL: {referer_url}")

    client_ip = get_client_ip(request_obj)
    check_rate_limit(client_ip)

    agent_mode = AGENT_MODE.get(request.model, {})
    trending_agent_mode = TRENDING_AGENT_MODE.get(request.model, {})
    model_prefix = MODEL_PREFIXES.get(request.model, "")

    headers_api_chat = get_headers_api_chat(referer_url)
    headers_chat = get_headers_chat(referer_url, next_action=str(uuid.uuid4()), next_router_state_tree=json.dumps([""]))
    validated_token = validate.getHid()

    if request.model == 'o1-preview':
        delay_seconds = random.randint(20, 60)
        logger.info(f"Introducing a delay of {delay_seconds} seconds for model 'o1-preview'")
        await asyncio.sleep(delay_seconds)

    json_data = {
        "agentMode": agent_mode,
        "clickedAnswer2": False,
        "clickedAnswer3": False,
        "clickedForceWebSearch": False,
        "codeModelMode": True,
        "githubToken": None,
        "isChromeExt": False,
        "isMicMode": False,
        "maxTokens": request.max_tokens,
        "messages": [message_to_dict(msg, model_prefix=model_prefix) for msg in request.messages],
        "mobileClient": False,
        "playgroundTemperature": request.temperature,
        "playgroundTopP": request.top_p,
        "previewToken": None,
        "trendingAgentMode": trending_agent_mode,
        "userId": None,
        "userSelectedModel": MODEL_MAPPING.get(request.model, request.model),
        "userSystemPrompt": None,
        "validated": validated_token,
        "visitFromDelta": False,
    }

    full_response = ""
    async with httpx.AsyncClient() as client:
        try:
            async with client.stream(
                method="POST", url=f"{BASE_URL}/api/chat", headers=headers_api_chat, json=json_data
            ) as response:
                response.raise_for_status()
                async for chunk in response.aiter_text():
                    full_response += chunk
        except httpx.HTTPStatusError as e:
            logger.error(f"HTTP error occurred (IP: {client_ip}): {e}")
            raise HTTPException(status_code=e.response.status_code, detail=str(e))
        except httpx.RequestError as e:
            logger.error(f"Error occurred during request (IP: {client_ip}): {e}")
            raise HTTPException(status_code=500, detail=str(e))
    if full_response.startswith("$@$v=undefined-rv1$@$"):
        full_response = full_response[21:]

    cleaned_full_response = strip_model_prefix(full_response, model_prefix)

    return {
        "id": f"chatcmpl-{uuid.uuid4()}",
        "object": "chat.completion",
        "created": int(datetime.now().timestamp()),
        "model": request.model,
        "choices": [
            {
                "index": 0,
                "message": {"role": "assistant", "content": cleaned_full_response},
                "finish_reason": "stop",
            }
        ],
        "usage": None,
    }