blakenp
/

Qwen2-0.5B-Reward

Text Classification

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Qwen2-0.5B-Reward / config.json

Commit History

rlhf_qwen2.5 0.5B

500a6c7
verified

blakenp commited on 16 days ago