Spaces:

matthoffner
/

open-codetree

Paused

App Files Files Community

matt HOFFNER commited on Oct 26, 2023

Commit

3816441

1 Parent(s): b4f7005

support passing a llm url directly

Browse files

Files changed (2) hide show

pages/api/chat/index.ts +5 -1
utils/llm.ts +88 -0

pages/api/chat/index.ts CHANGED Viewed

@@ -3,6 +3,7 @@ import { Configuration, OpenAIApi } from "openai-edge";
 import { HfInference } from '@huggingface/inference';
 import { HuggingFaceStream } from 'ai';
 import { experimental_buildLlama2Prompt } from 'ai/prompts';
 export const runtime = 'edge';
@@ -23,7 +24,10 @@ export default async function(req: Request) {
             content: systemMessage
         }, ...messages];
     }
-    if (aiProvider === 'openai') {
         const response = await openai.createChatCompletion({
             model: 'gpt-4',
             stream: true,

 import { HfInference } from '@huggingface/inference';
 import { HuggingFaceStream } from 'ai';
 import { experimental_buildLlama2Prompt } from 'ai/prompts';
+import { LLMStream } from "../../../utils/llm";
 export const runtime = 'edge';
             content: systemMessage
         }, ...messages];
     }
+    if (url) {
+        const stream = await LLMStream(url, messages);
+        return new StreamingTextResponse(stream);
+    } else if (aiProvider === 'openai') {
         const response = await openai.createChatCompletion({
             model: 'gpt-4',
             stream: true,

utils/llm.ts ADDED Viewed

	@@ -0,0 +1,88 @@

+import {
+  ParsedEvent,
+  ReconnectInterval,
+  createParser,
+} from 'eventsource-parser';
+export class LLMError extends Error {
+  type: string;
+  param: string;
+  code: string;
+  constructor(message: string, type: string, param: string, code: string) {
+    super(message);
+    this.name = 'LLMError';
+    this.type = type;
+    this.param = param;
+    this.code = code;
+  }
+}
+export const LLMStream = async (baseUrl: string, messages: any[]) => {
+    let url = `${baseUrl}/v1/chat/completions`;
+    const res = await fetch(url, {
+      headers: {
+        'Content-Type': 'application/json'
+      },
+      method: 'POST',
+      body: JSON.stringify({
+        messages,
+        stream: true,
+      }),
+    });
+    const encoder = new TextEncoder();
+    const decoder = new TextDecoder();
+    if (res.status !== 200) {
+      const result = await res.json();
+      if (result.error) {
+        throw new LLMError(
+          result.error.message,
+          result.error.type,
+          result.error.param,
+          result.error.code,
+        );
+      } else {
+        throw new Error(
+          `API returned an error: ${
+            decoder.decode(result?.value) || result.statusText
+          }`,
+        );
+      }
+    }
+    const stream = new ReadableStream({
+      async start(controller) {
+        let accumulatedContent = ""; // To accumulate message content
+        const onParse = (event: ParsedEvent | ReconnectInterval) => {
+          if (event.type === 'event') {
+            const data = event.data;
+            if (data === '[DONE]') {
+              const queue = encoder.encode(accumulatedContent);
+              controller.enqueue(queue);
+              controller.close();
+              return;
+            }
+            try {
+              const parsedData = JSON.parse(data);
+              const content = parsedData?.choices?.[0]?.message?.content;
+              accumulatedContent += content ? content + " " : "";
+            } catch (e) {
+              controller.error(`Error parsing message: ${e}`);
+            }
+          }
+        };
+        const parser = createParser(onParse);
+        for await (const chunk of res.body as any) {
+          parser.feed(decoder.decode(chunk));
+        }
+      },
+    });
+    return stream;
+  };