general-preference
/

GPM-Gemma-2B

Model card Files Files and versions Community

kirigayahitsugi commited on Oct 8, 2024

Commit

2631853

·

verified ·

1 Parent(s): 9c37999

Update README.md

Files changed (1) hide show

README.md +9 -3

README.md CHANGED Viewed

@@ -1,3 +1,9 @@
----
-license: apache-2.0
----

+---
+license: apache-2.0
+---
+# Introduction
+This reward model is finetuned from the [google/gemma-2b-it](https://huggingface.co/google/gemma-2b-it) using the dataset [Skywork/Skywork-Reward-Preference-80K-v0.1](https://huggingface.co/datasets/Skywork/Skywork-Reward-Preference-80K-v0.1)
+# Evaluation
+This reward model is evaluated using evaluation code adapted from [RewardBench](https://github.com/allenai/reward-bench). For detailed code information, please refer to [general-preference-model](https://github.com/general-preference/general-preference-model).
+# Usage
+Please refer to [general-preference-model](https://github.com/general-preference/general-preference-model) for detailed usage instructions.