zkshan2002
/

DPO-uf-llama3-8B-OpenRLHF

Model card Files Files and versions Community

zkshan2002 commited on Oct 14

Commit

b878162

•

1 Parent(s): e0fe0f0

Create README.md

Files changed (1) hide show

README.md +6 -0

README.md ADDED Viewed

	@@ -0,0 +1,6 @@

+---
+datasets:
+- HuggingFaceH4/ultrafeedback_binarized
+base_model:
+- OpenRLHF/Llama-3-8b-sft-mixture
+---