CharlesLi
/

mistral_rlhf_safe_llama_3_70B_reflect_1000_full

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

mistral_rlhf_safe_llama_3_70B_reflect_1000_full

Commit History

End of training

baa0438
verified

CharlesLi commited on 15 days ago

Model save

15fe91e
verified

CharlesLi commited on 15 days ago

initial commit

f94ed08
verified

CharlesLi commited on 15 days ago