api-test

Runtime error

App Files Files Community

OjciecTadeusz commited on Nov 15, 2024

Commit

a2280d2

verified ·

1 Parent(s): 1f6cb85

Update app.py

Browse files

Files changed (1) hide show

app.py +51 -3

app.py CHANGED Viewed

@@ -1,3 +1,12 @@
 from fastapi import FastAPI, Request, HTTPException
 from fastapi.responses import JSONResponse
 import datetime
@@ -15,7 +24,7 @@ logger = logging.getLogger(__name__)
 # Configuration
 API_URL = "https://api-inference.huggingface.co/models/Qwen/Qwen2.5-Coder-32B"
 headers = {
-    "Authorization": f"Bearer {os.getenv('HF_API_TOKEN')}",
     "Content-Type": "application/json"
 }
@@ -93,13 +102,52 @@ async def chat_completion(request: Request):
         logger.error(f"Unexpected error: {e}")
         raise HTTPException(status_code=500, detail=str(e))
 def chat_interface(messages):
     chat_history = []
 # Create Gradio interface
 def gradio_app():
-    #return gr.chat_interface(gr.Chatbot(placeholder="placeholder"), type="messages", value=[])
     return gr.ChatInterface(chat_interface, type="messages")
-# Mount both FastAPI and Gradio

+import gradio as gr
+from fastapi import FastAPI, Request
+from fastapi.responses import JSONResponse
+import datetime
+import requests
+import os
+import json
+import asyncio
 from fastapi import FastAPI, Request, HTTPException
 from fastapi.responses import JSONResponse
 import datetime
 # Configuration
 API_URL = "https://api-inference.huggingface.co/models/Qwen/Qwen2.5-Coder-32B"
 headers = {
+    "Authorization": f"Bearer {$(cat /run/secrets/SECRET_EXAMPLE)}",
     "Content-Type": "application/json"
 }
         logger.error(f"Unexpected error: {e}")
         raise HTTPException(status_code=500, detail=str(e))
+def generate_response(messages):
+    payload = {
+        "inputs": {
+            "messages": messages
+        },
+        "parameters": {
+            "max_new_tokens": 2048,
+            "temperature": 0.7,
+            "top_p": 0.95,
+            "do_sample": True
+        }
+    }
+    try:
+        response = requests.post(API_URL, headers=headers, json=payload)
+        response.raise_for_status()
+        result = response.json()
+        if isinstance(result, dict) and "error" in result:
+            return f"Error: {result['error']}"
+        return result[0]["generated_text"]
+    except requests.exceptions.RequestException as e:
+        logger.error(f"Request failed: {e}")
+        return f"Error: {e}"
 def chat_interface(messages):
     chat_history = []
+    for message in messages:
+        try:
+            response = generate_response([{"role": "user", "content": message}])
+            chat_history.append({"role": "user", "content": message})
+            chat_history.append({"role": "assistant", "content": response})
+        except Exception as e:
+            chat_history.append({"role": "user", "content": message})
+            chat_history.append({"role": "assistant", "content": f"Error: {str(e)}"})
+    return chat_history
 # Create Gradio interface
 def gradio_app():
     return gr.ChatInterface(chat_interface, type="messages")
+# Mount both FastAPI and Gradio
+app = gr.mount_gradio_app(app, gradio_app(), path="/")
+# For running with uvicorn directly
+if __name__ == "__main__":
+    import uvicorn
+    uvicorn.run(app, host="0.0.0.0", port=7860)