pkbiswas
/

Phi-3-Detoxified-PPO-LoRa

Reinforcement Learning

Inference Endpoints

Model card Files Files and versions Community

Phi-3-Detoxified-PPO-LoRa

Commit History

Push model using huggingface_hub.

66a811a
verified

pkbiswas commited on May 18, 2024

Upload tokenizer

d569e95
verified

pkbiswas commited on May 2, 2024

Upload Phi3ForCausalLM

03b471c
verified

pkbiswas commited on May 2, 2024

Upload tokenizer

f1fcb3e
verified

pkbiswas commited on May 2, 2024

Upload Phi3ForCausalLM

421110d
verified

pkbiswas commited on May 2, 2024

Push model using huggingface_hub.

bfb7444
verified

pkbiswas commited on May 2, 2024

initial commit

4a22299
verified

pkbiswas commited on May 2, 2024