CharlesLi
/

mistral_rlhf_safe_llama_3_70B_reflect_1000_full

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

mistral_rlhf_safe_llama_3_70B_reflect_1000_full / training_args.bin

Commit History

Model save

15fe91e
verified

CharlesLi commited on 1 day ago