S4nto
/

lora-dpo-finetuned-model-beta-0.4-rate-1e5-stage2-iter40000-sft

Inference Endpoints

Model card Files Files and versions Community

lora-dpo-finetuned-model-beta-0.4-rate-1e5-stage2-iter40000-sft

Commit History

Upload tokenizer

e40aacb
verified

S4nto commited on May 16, 2024

Upload model

dc89532
verified

S4nto commited on May 16, 2024

initial commit

cd84738
verified

S4nto commited on May 16, 2024