Update README.md

Browse files

Files changed (1) hide show

README.md +21 -21

README.md CHANGED Viewed

@@ -166,27 +166,27 @@ lm_eval --model hf --model_args pretrained=microsoft/Phi-4-mini-instruct --tasks
 lm_eval --model hf --model_args pretrained=pytorch/Phi-4-mini-instruct-8da4w --tasks hellaswag --device cuda:0 --batch_size 8
 ```
-| Benchmark                        |             |                   |
-|----------------------------------|-------------|-------------------|
-|                                  | Phi-4 mini-Ins | phi4-mini-8da4w|
-| **Popular aggregated benchmark** |             |                   |
-| mmlu (0 shot)                    | 66.73       | 60.75             |
-| mmlu_pro (5-shot)                | 46.43	     | 11.75             |
-| **Reasoning**                    |             |                   |
-| arc_challenge                    | 56.91       | 48.46             |
-| gpqa_main_zeroshot               | 30.13       | 30.80             |
-| hellaswag                        | 54.57       | 50.35             |
-| openbookqa                       | 33.00       | 30.40             |
-| piqa (0-shot)                    | 77.64       | 74.43             |
-| siqa                             | 49.59       | 44.98             |
-| truthfulqa_mc2 (0-shot)          | 48.39       | 51.35             |
-| winogrande (0-shot)              | 71.11       | 70.32             |
-| **Multilingual**                 |             |                   |
-| mgsm_en_cot_en                   | 60.80       | 57.60             |
-| **Math**                         |             |                   |
-| gsm8k (5-shot)                   | 81.88       | 61.71             |
-| Mathqa (0-shot)                  | 42.31       | 36.95             |
-| **Overall**                      | 55.35       | 48.45             |
 # Exporting to ExecuTorch

 lm_eval --model hf --model_args pretrained=pytorch/Phi-4-mini-instruct-8da4w --tasks hellaswag --device cuda:0 --batch_size 8
 ```
+| Benchmark                        |                |                           |
+|----------------------------------|----------------|---------------------------|
+|                                  | Phi-4-mini-ins | Phi-4-mini-instruct-8da4w |
+| **Popular aggregated benchmark** |                |                           |
+| mmlu (0 shot)                    | 66.73          | 60.75                     |
+| mmlu_pro (5-shot)                | 46.43	        | 11.75                     |
+| **Reasoning**                    |                |                           |
+| arc_challenge                    | 56.91          | 48.46                     |
+| gpqa_main_zeroshot               | 30.13          | 30.80                     |
+| hellaswag                        | 54.57          | 50.35                     |
+| openbookqa                       | 33.00          | 30.40                     |
+| piqa (0-shot)                    | 77.64          | 74.43                     |
+| siqa                             | 49.59          | 44.98                     |
+| truthfulqa_mc2 (0-shot)          | 48.39          | 51.35                     |
+| winogrande (0-shot)              | 71.11          | 70.32                     |
+| **Multilingual**                 |                |                           |
+| mgsm_en_cot_en                   | 60.80          | 57.60                     |
+| **Math**                         |                |                           |
+| gsm8k (5-shot)                   | 81.88          | 61.71                     |
+| Mathqa (0-shot)                  | 42.31          | 36.95                     |
+| **Overall**                      | 55.35          | 48.45                     |
 # Exporting to ExecuTorch