Spaces:

rapacious
/

AIAPI

Running

App Files Files Community

rapacious commited on Mar 8

Commit

9a76509

verified ·

1 Parent(s): 1ec8046

Update app.py

Browse files

Files changed (1) hide show

app.py +55 -24

app.py CHANGED Viewed

@@ -1,8 +1,10 @@
-import uvicorn
 from fastapi import FastAPI, HTTPException, Request
 from pydantic import BaseModel
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
 # Khởi tạo FastAPI
 app = FastAPI()
@@ -22,58 +24,87 @@ except Exception as e:
     print(f"Error loading model: {e}")
     raise
-# Định nghĩa request body
 class TextInput(BaseModel):
     prompt: str
     max_length: int = 100
-# API endpoint để sinh văn bản
-@app.post("/generate")
-async def generate_text(input: TextInput):
     try:
-        # Mã hóa đầu vào
-        inputs = tokenizer(input.prompt, return_tensors="pt").to(model.device)
-        # Sinh văn bản
         outputs = model.generate(
             inputs["input_ids"],
-            max_length=input.max_length,
             num_return_sequences=1,
             no_repeat_ngram_size=2,
             do_sample=True,
             top_k=50,
             top_p=0.95
         )
-        # Giải mã kết quả
-        generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
-        return {"generated_text": generated_text}
     except Exception as e:
         raise HTTPException(status_code=500, detail=str(e))
-# Endpoint kiểm tra sức khỏe
 @app.get("/")
 async def root():
     return {"message": "Qwen2.5-0.5B API is running!"}
-# Endpoint hiển thị API URL đầy đủ
 @app.get("/api_link")
 async def get_api_link(request: Request):
-    # Lấy host từ request
-    host = request.client.host
-    # Lấy port từ server (nếu chạy local thì mặc định là 7860)
-    port = request.url.port if request.url.port else 7860
-    # Tạo URL đầy đủ
-    base_url = f"http://{host}:{port}"
     return {
         "api_url": base_url,
         "endpoints": {
             "health_check": f"{base_url}/",
             "generate_text": f"{base_url}/generate",
-            "api_link": f"{base_url}/api_link"
         }
     }
-# Chạy server khi file được gọi trực tiếp
 if __name__ == "__main__":
     uvicorn.run(app, host="0.0.0.0", port=7860)

+import gradio as gr
 from fastapi import FastAPI, HTTPException, Request
 from pydantic import BaseModel
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
+import uvicorn
+from fastapi.responses import HTMLResponse
 # Khởi tạo FastAPI
 app = FastAPI()
     print(f"Error loading model: {e}")
     raise
+# Định nghĩa request body cho API
 class TextInput(BaseModel):
     prompt: str
     max_length: int = 100
+# Hàm sinh văn bản (dùng chung cho API và Gradio)
+def generate_text(prompt, max_length=100):
     try:
+        inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
         outputs = model.generate(
             inputs["input_ids"],
+            max_length=max_length,
             num_return_sequences=1,
             no_repeat_ngram_size=2,
             do_sample=True,
             top_k=50,
             top_p=0.95
         )
+        return tokenizer.decode(outputs[0], skip_special_tokens=True)
+    except Exception as e:
+        raise Exception(f"Error: {str(e)}")
+# API endpoint để sinh văn bản
+@app.post("/generate")
+async def generate_text_api(input: TextInput):
+    try:
+        result = generate_text(input.prompt, input.max_length)
+        return {"generated_text": result}
     except Exception as e:
         raise HTTPException(status_code=500, detail=str(e))
+# API endpoint kiểm tra sức khỏe
 @app.get("/")
 async def root():
     return {"message": "Qwen2.5-0.5B API is running!"}
+# API endpoint hiển thị URL
 @app.get("/api_link")
 async def get_api_link(request: Request):
+    scheme = request.url.scheme
+    host = request.url.hostname
+    if request.url.port:
+        base_url = f"{scheme}://{host}:{request.url.port}"
+    else:
+        base_url = f"{scheme}://{host}"
     return {
         "api_url": base_url,
         "endpoints": {
             "health_check": f"{base_url}/",
             "generate_text": f"{base_url}/generate",
+            "api_link": f"{base_url}/api_link",
+            "interface": f"{base_url}/interface"
         }
     }
+# Tạo giao diện Gradio
+def create_gradio_interface():
+    with gr.Blocks(title="Qwen2.5-0.5B Text Generator") as demo:
+        gr.Markdown("# Qwen2.5-0.5B Text Generator")
+        gr.Markdown("Enter a prompt and get generated text!")
+        with gr.Row():
+            prompt_input = gr.Textbox(label="Prompt", placeholder="Type something...")
+            max_length_input = gr.Slider(50, 500, value=100, step=10, label="Max Length")
+        generate_button = gr.Button("Generate")
+        output_text = gr.Textbox(label="Generated Text", interactive=False)
+        generate_button.click(
+            fn=generate_text,
+            inputs=[prompt_input, max_length_input],
+            outputs=output_text
+        )
+    return demo
+# Thêm endpoint để hiển thị giao diện Gradio
+@app.get("/interface", response_class=HTMLResponse)
+async def gradio_interface(request: Request):
+    gradio_app = create_gradio_interface()
+    return HTMLResponse(content=gradio_app.render())
+# Chạy ứng dụng nếu không trên Hugging Face Spaces
 if __name__ == "__main__":
     uvicorn.run(app, host="0.0.0.0", port=7860)