line-corporation
/

p-sacpo

Reinforcement Learning

text-generation

reinforcement-learning-from-human-feedback

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

p-sacpo / model-00001-of-00003.safetensors

Commit History

Upload LlamaForCausalLM

b36098b
verified

reisato80 commited on Jun 19, 2024