abshetty
/

llava-lora-12-06-rpo-0.1

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

llava-lora-12-06-rpo-0.1

Commit History

Update README.md

024f6c6
verified

abshetty commited on 21 days ago

abshetty/llava-dpo-rpo-0.1

1cf7acf
verified

abshetty commited on 21 days ago

initial commit

ea15102
verified

abshetty commited on 21 days ago