Spaces:

metunlp
/

model-eval-be

Running on L4

ecemumutlu commited on 23 days ago

Commit

aee6c99

1 Parent(s): 1b1e5f4

Fix pydantic errors

Files changed (1) hide show

svc/router.py CHANGED Viewed

@@ -9,7 +9,7 @@ from dotenv import load_dotenv
 import os
 import json
 from src.deepeval.deepeval_task_manager import DeepEvalTaskManager
 router = APIRouter()
@@ -34,6 +34,8 @@ async def protected_route(username: str = Depends(get_current_user)):
 @router.post("/chat",  response_model=TaskResponse)
 def inference_model(request: LMHarnessTaskRequest, username: str = Depends(get_current_user)):
     try:
         logger.info("Inside")
         results = evaluator.simple_evaluate(
@@ -49,6 +51,8 @@ def inference_model(request: LMHarnessTaskRequest, username: str = Depends(get_c
     except Exception as e:
         raise HTTPException(status_code=500, detail=f"lm-harness task execution failed for model: {request.model_args}")
     results["config"]["model_dtype"] = request.precision
     model_name = request.model_args.split(",")[0].split("=")[1]
@@ -67,6 +71,8 @@ def inference_model(request: LMHarnessTaskRequest, username: str = Depends(get_c
 async def deep_eval_suite(request: DeepEvalSuiteRequest):
     des = DeepEvalTaskManager(request.model_name, request.tasks)
     results = des.run_tasks() #TODO: format should be different. Check metunlp/results repo for the correct format
-    return TaskResponse(results=results)

 import os
 import json
 from src.deepeval.deepeval_task_manager import DeepEvalTaskManager
+import torch
 router = APIRouter()
 @router.post("/chat",  response_model=TaskResponse)
 def inference_model(request: LMHarnessTaskRequest, username: str = Depends(get_current_user)):
+    logger.info(request)
     try:
         logger.info("Inside")
         results = evaluator.simple_evaluate(
     except Exception as e:
         raise HTTPException(status_code=500, detail=f"lm-harness task execution failed for model: {request.model_args}")
+    torch.cuda.empty_cache()
     results["config"]["model_dtype"] = request.precision
     model_name = request.model_args.split(",")[0].split("=")[1]
 async def deep_eval_suite(request: DeepEvalSuiteRequest):
     des = DeepEvalTaskManager(request.model_name, request.tasks)
     results = des.run_tasks() #TODO: format should be different. Check metunlp/results repo for the correct format
+    json_results = json.dumps(results)
+    return TaskResponse(results=json_results)