AmberYifan
/

Llama-3.1-8B-sft-hhrlhf-dpo

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Llama-3.1-8B-sft-hhrlhf-dpo / model-00003-of-00004.safetensors

Commit History

Training in progress, epoch 3

d00351c
verified

AmberYifan commited on 9 days ago

Training in progress, epoch 2

1ff94fc
verified

AmberYifan commited on 9 days ago

Training in progress, epoch 1

59a0a71
verified

AmberYifan commited on 9 days ago