line-corporation
/

p-sacpo

Reinforcement Learning

text-generation

reinforcement-learning-from-human-feedback

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

p-sacpo / config.json

Commit History

Upload LlamaForCausalLM

b36098b
verified

reisato80 commited on Jun 19