Spaces:

rapacious
/

AIAPI

Running

rapacious commited on Mar 8

Commit

59cd1f7

verified ·

1 Parent(s): df8c7cb

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,3 +1,4 @@
 from fastapi import FastAPI, HTTPException
 from pydantic import BaseModel
 from transformers import AutoModelForCausalLM, AutoTokenizer
@@ -8,8 +9,18 @@ app = FastAPI()
 # Tải model và tokenizer khi ứng dụng khởi động
 model_name = "Qwen/Qwen2.5-0.5B"
-tokenizer = AutoTokenizer.from_pretrained(model_name)
-model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype="auto", device_map="auto")
 # Định nghĩa request body
 class TextInput(BaseModel):
@@ -43,4 +54,8 @@ async def generate_text(input: TextInput):
 # Endpoint kiểm tra sức khỏe
 @app.get("/")
 async def root():
-    return {"message": "Qwen2.5-0.5B API is running!"}

+import uvicorn
 from fastapi import FastAPI, HTTPException
 from pydantic import BaseModel
 from transformers import AutoModelForCausalLM, AutoTokenizer
 # Tải model và tokenizer khi ứng dụng khởi động
 model_name = "Qwen/Qwen2.5-0.5B"
+try:
+    tokenizer = AutoTokenizer.from_pretrained(model_name)
+    model = AutoModelForCausalLM.from_pretrained(
+        model_name,
+        torch_dtype="auto",
+        device_map="auto",
+        attn_implementation="eager"  # Tránh cảnh báo sdpa
+    )
+    print("Model and tokenizer loaded successfully!")
+except Exception as e:
+    print(f"Error loading model: {e}")
+    raise
 # Định nghĩa request body
 class TextInput(BaseModel):
 # Endpoint kiểm tra sức khỏe
 @app.get("/")
 async def root():
+    return {"message": "Qwen2.5-0.5B API is running!"}
+# Chạy server khi file được gọi trực tiếp
+if __name__ == "__main__":
+    uvicorn.run(app, host="0.0.0.0", port=7860)