Decision-Tree Reward Models - a RLHFlow Collection

RLHFlow 's Collections

Decision-Tree Reward Models

RLHFlow MATH Process Reward Model

Standard-format-preference-dataset

Mixture-of-preference-reward-modeling

RM-Bradley-Terry

PM-pair

RLHFLow Reward Models

Decision-Tree Reward Models

updated 6 days ago

RLHFlow/Decision-Tree-Reward-Gemma-2-27B

Text Classification • Updated 18 days ago • 65 • 3
RLHFlow/Decision-Tree-Reward-Llama-3.1-8B

Text Classification • Updated 18 days ago • 335 • 3
RLHFlow/LLM-Preferences-HelpSteer2

Viewer • Updated 6 days ago • 9.13k • 43