Spaces:

rapacious
/

AIAPI

Running

App Files Files Community

rapacious commited on Mar 8

Commit

ac716aa

verified ·

1 Parent(s): 9a76509

Update app.py

Browse files

Files changed (1) hide show

app.py +63 -71

app.py CHANGED Viewed

@@ -1,13 +1,6 @@
 import gradio as gr
-from fastapi import FastAPI, HTTPException, Request
-from pydantic import BaseModel
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
-import uvicorn
-from fastapi.responses import HTMLResponse
-# Khởi tạo FastAPI
-app = FastAPI()
 # Tải model và tokenizer khi ứng dụng khởi động
 model_name = "Qwen/Qwen2.5-0.5B"
@@ -24,12 +17,7 @@ except Exception as e:
     print(f"Error loading model: {e}")
     raise
-# Định nghĩa request body cho API
-class TextInput(BaseModel):
-    prompt: str
-    max_length: int = 100
-# Hàm sinh văn bản (dùng chung cho API và Gradio)
 def generate_text(prompt, max_length=100):
     try:
         inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
@@ -44,67 +32,71 @@ def generate_text(prompt, max_length=100):
         )
         return tokenizer.decode(outputs[0], skip_special_tokens=True)
     except Exception as e:
-        raise Exception(f"Error: {str(e)}")
-# API endpoint để sinh văn bản
-@app.post("/generate")
-async def generate_text_api(input: TextInput):
-    try:
-        result = generate_text(input.prompt, input.max_length)
-        return {"generated_text": result}
-    except Exception as e:
-        raise HTTPException(status_code=500, detail=str(e))
-# API endpoint kiểm tra sức khỏe
-@app.get("/")
-async def root():
-    return {"message": "Qwen2.5-0.5B API is running!"}
-# API endpoint hiển thị URL
-@app.get("/api_link")
-async def get_api_link(request: Request):
-    scheme = request.url.scheme
-    host = request.url.hostname
-    if request.url.port:
-        base_url = f"{scheme}://{host}:{request.url.port}"
-    else:
-        base_url = f"{scheme}://{host}"
-    return {
-        "api_url": base_url,
-        "endpoints": {
-            "health_check": f"{base_url}/",
-            "generate_text": f"{base_url}/generate",
-            "api_link": f"{base_url}/api_link",
-            "interface": f"{base_url}/interface"
-        }
-    }
 # Tạo giao diện Gradio
-def create_gradio_interface():
-    with gr.Blocks(title="Qwen2.5-0.5B Text Generator") as demo:
-        gr.Markdown("# Qwen2.5-0.5B Text Generator")
-        gr.Markdown("Enter a prompt and get generated text!")
-        with gr.Row():
-            prompt_input = gr.Textbox(label="Prompt", placeholder="Type something...")
-            max_length_input = gr.Slider(50, 500, value=100, step=10, label="Max Length")
-        generate_button = gr.Button("Generate")
-        output_text = gr.Textbox(label="Generated Text", interactive=False)
-        generate_button.click(
-            fn=generate_text,
-            inputs=[prompt_input, max_length_input],
-            outputs=output_text
-        )
-    return demo
-# Thêm endpoint để hiển thị giao diện Gradio
-@app.get("/interface", response_class=HTMLResponse)
-async def gradio_interface(request: Request):
-    gradio_app = create_gradio_interface()
-    return HTMLResponse(content=gradio_app.render())
-# Chạy ứng dụng nếu không trên Hugging Face Spaces
-if __name__ == "__main__":
-    uvicorn.run(app, host="0.0.0.0", port=7860)

 import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
 # Tải model và tokenizer khi ứng dụng khởi động
 model_name = "Qwen/Qwen2.5-0.5B"
     print(f"Error loading model: {e}")
     raise
+# Hàm sinh văn bản (dùng cho cả UI và API)
 def generate_text(prompt, max_length=100):
     try:
         inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
         )
         return tokenizer.decode(outputs[0], skip_special_tokens=True)
     except Exception as e:
+        return f"Error: {str(e)}"
+# Hàm hiển thị thông tin API
+def get_api_info():
+    # Trên Hugging Face Spaces, API URL sẽ dựa trên tên Space
+    # Khi chạy local, ta giả định port 7860
+    base_url = "http://localhost:7860" if gr.context.local else "https://<your-space-name>.hf.space"
+    return (
+        "Welcome to Qwen2.5-0.5B API!\n"
+        f"API Base URL: {base_url}\n"
+        "Endpoints:\n"
+        f"- GET {base_url}/api/health_check (Check API status)\n"
+        f"- POST {base_url}/api/generate (Generate text)\n"
+        "To use the generate API, send a POST request with JSON:\n"
+        '{"prompt": "your prompt", "max_length": 150}'
+    )
+# Hàm kiểm tra sức khỏe (dành cho API)
+def health_check():
+    return "Qwen2.5-0.5B API is running!"
 # Tạo giao diện Gradio
+with gr.Blocks(title="Qwen2.5-0.5B Text Generator") as demo:
+    gr.Markdown("# Qwen2.5-0.5B Text Generator")
+    gr.Markdown("Enter a prompt below or use the API!")
+    # Hiển thị thông tin API
+    gr.Markdown("### API Information")
+    api_info = gr.Textbox(label="API Details", value=get_api_info(), interactive=False)
+    # Giao diện sinh văn bản
+    gr.Markdown("### Generate Text")
+    with gr.Row():
+        prompt_input = gr.Textbox(label="Prompt", placeholder="Type something...")
+        max_length_input = gr.Slider(50, 500, value=100, step=10, label="Max Length")
+    generate_button = gr.Button("Generate")
+    output_text = gr.Textbox(label="Generated Text", interactive=False)
+    # Liên kết button với hàm generate_text
+    generate_button.click(
+        fn=generate_text,
+        inputs=[prompt_input, max_length_input],
+        outputs=output_text
+    )
+# Định nghĩa API endpoints với Gradio
+demo = gr.Interface(
+    fn=generate_text,
+    inputs=["text", "number"],
+    outputs="text",
+    title="Qwen2.5-0.5B API",
+    api_name="/generate"  # API endpoint: /api/generate
+).queue()
+# Thêm endpoint health check
+health_interface = gr.Interface(
+    fn=health_check,
+    inputs=None,
+    outputs="text",
+    api_name="/health_check"  # API endpoint: /api/health_check
+)
+# Kết hợp giao diện và API
+app = gr.mount_gradio_app(demo, health_interface)
+# Chạy ứng dụng
+demo.launch(server_name="0.0.0.0", server_port=7860)