Spaces:

metunlp
/

model-eval-be

Paused

Ahmet Kaan Sever commited on 1 day ago

Commit

9c25ebd

1 Parent(s): 771dabb

Distinguished bias mc and bias oe

Files changed (2) hide show

src/deepeval/bias_task.py CHANGED Viewed

@@ -4,7 +4,7 @@ from deepeval.metrics import BiasMetric
 from deepeval.test_case import LLMTestCase
 from typing import Any
-class BiasTask(BaseTask):
     def __init__(self, model_name: str):
         super().__init__("metunlp/sosyoloji_bias", model_name=model_name)
@@ -56,7 +56,7 @@ class BiasTask(BaseTask):
             })
             #Sum all scores in results and divide to nubmer of results
             overallScore = (sum([result["score"] for result in results]) / len(results)) * 100
         print(f"Total model time: {total_model_time} seconds")
         print(f"Total judge time: {total_judge_time} seconds")
         return {"results": overallScore}

 from deepeval.test_case import LLMTestCase
 from typing import Any
+class BiasTaskOE(BaseTask):
     def __init__(self, model_name: str):
         super().__init__("metunlp/sosyoloji_bias", model_name=model_name)
             })
             #Sum all scores in results and divide to nubmer of results
             overallScore = (sum([result["score"] for result in results]) / len(results)) * 100
         print(f"Total model time: {total_model_time} seconds")
         print(f"Total judge time: {total_judge_time} seconds")
         return {"results": overallScore}

src/deepeval/deepeval_task_manager.py CHANGED Viewed

@@ -7,7 +7,7 @@ from src.deepeval.commonsense_reasoning_task import CommonsenseReasoningTask
 from src.deepeval.summarization_task import SummarizationTask
 from src.deepeval.faithfulness_task import FaithfulnessTask
 from src.deepeval.toxicity_task import ToxicityTask
-from src.deepeval.bias_task import BiasTask
 from src.deepeval.instruction_following_task import InstructionFollowingTask
 from src.deepeval.reading_comprehension_task import ReadingComprehensionTask
 from src.deepeval.reading_comp_mc import ReadingComprehensionMCTask
@@ -119,7 +119,7 @@ class DeepEvalTaskManager:
         return res
     def sosyoloji_bias(self):
-        bias_task = BiasTask(self.model_name)
         res = bias_task.evaluate()
         return res

 from src.deepeval.summarization_task import SummarizationTask
 from src.deepeval.faithfulness_task import FaithfulnessTask
 from src.deepeval.toxicity_task import ToxicityTask
+from src.deepeval.bias_task import BiasTaskOE
 from src.deepeval.instruction_following_task import InstructionFollowingTask
 from src.deepeval.reading_comprehension_task import ReadingComprehensionTask
 from src.deepeval.reading_comp_mc import ReadingComprehensionMCTask
         return res
     def sosyoloji_bias(self):
+        bias_task = BiasTaskOE(self.model_name)
         res = bias_task.evaluate()
         return res