btaskel
/

Tifa-DeepsexV2-7b-MGRPO-safetensors

Reinforcement Learning

text-generation

incremental-pretraining

text-generation-inference

Model card Files Files and versions

Tifa-DeepsexV2-7b-MGRPO-safetensors / model-00002-of-00004.safetensors

Commit History

Upload model-00002-of-00004.safetensors

601d515
verified

btaskel commited on Mar 2