yuansui
/

TinyLLama-v0-PPO-tuned

Reinforcement Learning

Inference Endpoints

Model card Files Files and versions Community

TinyLLama-v0-PPO-tuned / pytorch_model.bin

Commit History

Push model using huggingface_hub.

62bbcda
verified

yuansui commited on Sep 6