zkshan2002
/

DPO-uf-llama3-8B-OpenRLHF

Model card Files Files and versions Community

DPO-uf-llama3-8B-OpenRLHF / README.md

zkshan2002's picture

Create README.md

b878162 verified 3 months ago

|

103 Bytes

metadata

datasets:
  - HuggingFaceH4/ultrafeedback_binarized
base_model:
  - OpenRLHF/Llama-3-8b-sft-mixture