pkbiswas
/

Phi-3-Detoxified-PPO-LoRa

Reinforcement Learning

Inference Endpoints

Model card Files Files and versions Community

Phi-3-Detoxified-PPO-LoRa / generation_config.json

Commit History

Upload Phi3ForCausalLM

421110d
verified

pkbiswas commited on May 2, 2024