abshetty
/

llava-lora-12-06-rpo-0.1

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

llava-lora-12-06-rpo-0.1 / runs

1 contributor

History: 1 commit

abshetty's picture

abshetty/llava-dpo-rpo-0.1

1cf7acf verified 21 days ago

Dec06_23-25-21_44e6786cc318
abshetty/llava-dpo-rpo-0.1 21 days ago