bikalnetomi
/

RLHF-PPO-RewardModel-LLama3-1B-v1.1

Text Classification

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

RLHF-PPO-RewardModel-LLama3-1B-v1.1

Commit History

bikalnetomi/RLHF-PPO-RewardModel-LLama3-1B-v1.1

ba36b53
verified

bikalnetomi commited on Dec 1, 2024

initial commit

01b6d5e
verified

bikalnetomi commited on Dec 1, 2024