S4nto
/

lora-dpo-finetuned-model-beta-0.1-rate-1e6-stage2-iter40000-sft

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

lora-dpo-finetuned-model-beta-0.1-rate-1e6-stage2-iter40000-sft

Commit History

Upload tokenizer

eafbf31
verified

S4nto commited on May 15, 2024

Upload LlamaForCausalLM

51528f4
verified

S4nto commited on May 15, 2024

initial commit

20130ee
verified

S4nto commited on May 15, 2024