Shahradmz
/

Qwen2-0.5B-Instruct_continual_data_debug_PPO_0

Generated from Trainer

Model card Files Files and versions Community

Qwen2-0.5B-Instruct_continual_data_debug_PPO_0 / tokenizer.json

Commit History

Training in progress, step 3

4666642
verified

Shahradmz commited on Mar 4