Spaces:

metunlp
/

model-eval-be

Paused

ecemumutlu commited on Mar 4

Commit

f66ecbf

1 Parent(s): 57ba66f

Fix endpoint errors

Files changed (3) hide show

app.py CHANGED Viewed

@@ -1,3 +1,4 @@
 from fastapi import FastAPI
 from fastapi.middleware.cors import CORSMiddleware
 from svc.router import router
@@ -22,4 +23,8 @@ app.include_router(router, prefix="/api")
 @app.get("/")
 async def health_check():
-    return {"status": "healthy"}

+import uvicorn
 from fastapi import FastAPI
 from fastapi.middleware.cors import CORSMiddleware
 from svc.router import router
 @app.get("/")
 async def health_check():
+    return {"status": "healthy"}
+if __name__ == "__main__":
+    uvicorn.run(app, host="0.0.0.0", port=8080)

svc/router.py CHANGED Viewed

@@ -7,7 +7,7 @@ from fastapi.security import OAuth2PasswordRequestForm
 from auth.authentication import get_current_user, create_access_token
 from dotenv import load_dotenv
 import os
 router = APIRouter()
 logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
@@ -32,6 +32,7 @@ async def protected_route(username: str = Depends(get_current_user)):
 @router.post("/chat",  response_model=LMHarnessTaskResponse)
 def inference_model(request: LMHarnessTaskRequest, username: str = Depends(get_current_user)):
     try:
         results = evaluator.simple_evaluate(
             model=request.model,
             model_args=request.model_args,
@@ -45,6 +46,13 @@ def inference_model(request: LMHarnessTaskRequest, username: str = Depends(get_c
     except Exception as e:
         raise HTTPException(status_code=500, detail=f"lm-harness task execution failed for model: {request.model_args}")
-    logger.info(results)
-    return LMHarnessTaskResponse(results=results)

 from auth.authentication import get_current_user, create_access_token
 from dotenv import load_dotenv
 import os
+import json
 router = APIRouter()
 logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
 @router.post("/chat",  response_model=LMHarnessTaskResponse)
 def inference_model(request: LMHarnessTaskRequest, username: str = Depends(get_current_user)):
     try:
+        logger.info("Inside")
         results = evaluator.simple_evaluate(
             model=request.model,
             model_args=request.model_args,
     except Exception as e:
         raise HTTPException(status_code=500, detail=f"lm-harness task execution failed for model: {request.model_args}")
+    results["config"]["model_dtype"] = request.precision
+    results["config"]["model_name"] = request.model
+    results["config"]["model_sha"] = request.model_sha
+    dumped = json.dumps(results, indent=2)
+    logger.info("-------------------results------------------\n")
+    logger.info(dumped)
+    logger.info("-------------------results end------------------\n")
+    return LMHarnessTaskResponse(results=dumped)

svc/schemas.py CHANGED Viewed

@@ -1,4 +1,4 @@
-from pydantic import BaseModel
 from typing import List, Optional, Union, Any
@@ -16,14 +16,17 @@ class User(BaseModel):
 class LMHarnessTaskRequest(BaseModel):
     model: str
-    model_args: Optional[Union[str, dict]] = None
-    tasks: Optional[List[Union[str, dict, object]]] = None
     num_fewshot: Optional[int] = None
     batch_size: Optional[int] = None
     device: Optional[str] = None
-    limit: Optional[Union[int, float]] = None
     write_out: bool = False # Whether to write out an example document and model input, for checking task integrity
 class LMHarnessTaskResponse(BaseModel):
-    results: dict[Any,Any]

+from pydantic import BaseModel, Json
 from typing import List, Optional, Union, Any
 class LMHarnessTaskRequest(BaseModel):
     model: str
+    model_args: Optional[str] = None
+    tasks: Optional[List[str]] = None
     num_fewshot: Optional[int] = None
     batch_size: Optional[int] = None
     device: Optional[str] = None
+    limit: Optional[int] = None
     write_out: bool = False # Whether to write out an example document and model input, for checking task integrity
+    precision: str
+    model_name: str
+    model_sha: str
 class LMHarnessTaskResponse(BaseModel):
+    results: Json # dict[Any,Any]