line-corporation
/

p-sacpo

Reinforcement Learning

text-generation

reinforcement-learning-from-human-feedback

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Commit History

Update README.md

2901c06
verified

akifumiwachi commited on Jun 21

Update README.md

2bbc875
verified

reisato80 commited on Jun 21

Upload LlamaForCausalLM

b36098b
verified

reisato80 commited on Jun 19

Upload tokenizer

eff089a
verified

reisato80 commited on Jun 19

initial commit

234d482
verified

ospo-line commited on Jun 19