Weni
/

WeniGPT-2.2.3-Zephyr-7B-LLM_Base_2.0.3_SFT

@@ -5,9 +5,9 @@ tags:
 - trl
 - sft
 - generated_from_trainer
 datasets:
 - generator
-base_model: HuggingFaceH4/zephyr-7b-beta
 model-index:
 - name: WeniGPT-2.2.3-Zephyr-7B-LLM_Base_2.0.3_SFT
   results: []
@@ -69,4 +69,22 @@ The following hyperparameters were used during training:
 - Transformers 4.37.0.dev0
 - Pytorch 2.1.0+cu118
 - Datasets 2.16.1
-- Tokenizers 0.15.0

 - trl
 - sft
 - generated_from_trainer
+base_model: HuggingFaceH4/zephyr-7b-beta
 datasets:
 - generator
 model-index:
 - name: WeniGPT-2.2.3-Zephyr-7B-LLM_Base_2.0.3_SFT
   results: []
 - Transformers 4.37.0.dev0
 - Pytorch 2.1.0+cu118
 - Datasets 2.16.1
+- Tokenizers 0.15.0
+# Open Portuguese LLM Leaderboard Evaluation Results
+Detailed results can be found [here](https://huggingface.co/datasets/eduagarcia-temp/llm_pt_leaderboard_raw_results/tree/main/Weni/WeniGPT-2.2.3-Zephyr-7B-LLM_Base_2.0.3_SFT) and on the [🚀 Open Portuguese LLM Leaderboard](https://huggingface.co/spaces/eduagarcia/open_pt_llm_leaderboard)
+|          Metric          |  Value  |
+|--------------------------|---------|
+|Average                   |**45.86**|
+|ENEM Challenge (No Images)|    23.58|
+|BLUEX (No Images)         |    28.79|
+|OAB Exams                 |    26.33|
+|Assin2 RTE                |    87.01|
+|Assin2 STS                |    28.33|
+|FaQuAD NLI                |    44.66|
+|HateBR Binary             |    66.91|
+|PT Hate Speech Binary     |    56.25|
+|tweetSentBR               |    50.88|