olinguyen
/

Llama-3.2-1B-Instruct-orpo

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

olinguyen commited on Oct 25, 2024

Commit

65d202a

·

verified ·

1 Parent(s): 13a07b6

Update README.md

Files changed (1) hide show

README.md +7 -8

README.md CHANGED Viewed

@@ -11,9 +11,9 @@ tags: []
 ## Model Details
-Base model results:
-model=meta-llama/Llama-3.2-1B-Instruct
 |Tasks |Version|Filter|n-shot|        Metric         |   |Value |   |Stderr|
 |------|------:|------|-----:|-----------------------|---|-----:|---|------|
 |ifeval|      4|none  |     0|inst_level_loose_acc   |↑  |0.6475|±  |   N/A|
@@ -23,15 +23,14 @@ model=meta-llama/Llama-3.2-1B-Instruct
-Fine-tuned model results:
-model=meta-llama/Llama-3.2-1B-Instruct
 |Tasks |Version|Filter|n-shot|        Metric         |   |Value |   |Stderr|
 |------|------:|------|-----:|-----------------------|---|-----:|---|------|
-|ifeval|      4|none  |     0|inst_level_loose_acc   |↑  |0.6475|±  |   N/A|
-|      |       |none  |     0|inst_level_strict_acc  |↑  |0.4856|±  |   N/A|
-|      |       |none  |     0|prompt_level_loose_acc |↑  |0.5342|±  |0.0215|
-|      |       |none  |     0|prompt_level_strict_acc|↑  |0.3549|±  |0.0206|
 ### Model Description

 ## Model Details
+Base model (meta-llama/Llama-3.2-1B-Instruct) results:
 |Tasks |Version|Filter|n-shot|        Metric         |   |Value |   |Stderr|
 |------|------:|------|-----:|-----------------------|---|-----:|---|------|
 |ifeval|      4|none  |     0|inst_level_loose_acc   |↑  |0.6475|±  |   N/A|
+Fine-tuned model (meta-llama/Llama-3.2-1B-Instruct using [mlabonne/orpo-dpo-mix-40k](https://huggingface.co/datasets/mlabonne/orpo-dpo-mix-40k)) results:
 |Tasks |Version|Filter|n-shot|        Metric         |   |Value |   |Stderr|
 |------|------:|------|-----:|-----------------------|---|-----:|---|------|
+|ifeval|      4|none  |     0|inst_level_loose_acc   |↑  |0.5132|±  |   N/A|
+|      |       |none  |     0|inst_level_strict_acc  |↑  |0.4748|±  |   N/A|
+|      |       |none  |     0|prompt_level_loose_acc |↑  |0.3752|±  |0.0208|
+|      |       |none  |     0|prompt_level_strict_acc|↑  |0.3327|±  |0.0203|
 ### Model Description