Audreygyj
/

qwen-1.5b-sft-HH-offline-dpo

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

qwen-1.5b-sft-HH-offline-dpo / adapter_model.safetensors

Commit History

Training in progress, step 400

3052283
verified

Audreygyj commited on 18 days ago

Training in progress, step 300

a40fc5a
verified

Audreygyj commited on 18 days ago

Training in progress, step 200

27787ab
verified

Audreygyj commited on 18 days ago

Training in progress, step 100

371514b
verified

Audreygyj commited on 18 days ago

Training in progress, step 100

8bacf6d
verified

Audreygyj commited on 18 days ago