cleanrl

non-profit

https://github.com/vwxyzjn/cleanrl

vwxyzjn

vwxyzjn

Activity Feed Request to join this org

AI & ML interests

None defined yet.

cleanrl 's models 1,217

cleanrl/HalfCheetah-v4-td3_continuous_action-seed1

Reinforcement Learning • Updated Oct 11, 2023

cleanrl/Ant-v4-ddpg_continuous_action-seed1

Reinforcement Learning • Updated Oct 8, 2023

cleanrl/Swimmer-v4-ddpg_continuous_action-seed1

Reinforcement Learning • Updated Oct 8, 2023

cleanrl/HalfCheetah-v2-ddpg_continuous_action_jax-seed1

Reinforcement Learning • Updated Jun 30, 2023

cleanrl/Pusher-v2-ddpg_continuous_action-seed1

Reinforcement Learning • Updated Jun 29, 2023

cleanrl/Humanoid-v2-ddpg_continuous_action-seed1

Reinforcement Learning • Updated Jun 29, 2023

cleanrl/InvertedPendulum-v2-ddpg_continuous_action-seed1

Reinforcement Learning • Updated Jun 29, 2023

cleanrl/Hopper-v2-ddpg_continuous_action-seed1

Reinforcement Learning • Updated Jun 29, 2023

cleanrl/Walker2d-v2-ddpg_continuous_action-seed1

Reinforcement Learning • Updated Jun 29, 2023

cleanrl/HalfCheetah-v2-ddpg_continuous_action-seed1

Reinforcement Learning • Updated Jun 29, 2023

cleanrl/Pusher-v2-ddpg_continuous_action_jax-seed1

Reinforcement Learning • Updated Jun 29, 2023

cleanrl/Humanoid-v2-ddpg_continuous_action_jax-seed1

Reinforcement Learning • Updated Jun 29, 2023

cleanrl/InvertedPendulum-v2-ddpg_continuous_action_jax-seed1

Reinforcement Learning • Updated Jun 29, 2023

cleanrl/Hopper-v2-ddpg_continuous_action_jax-seed1

Reinforcement Learning • Updated Jun 29, 2023

cleanrl/Walker2d-v2-ddpg_continuous_action_jax-seed1

Reinforcement Learning • Updated Jun 29, 2023

cleanrl/Pusher-v4-ddpg_continuous_action-seed1

Reinforcement Learning • Updated Jun 28, 2023

cleanrl/Humanoid-v4-ddpg_continuous_action-seed1

Reinforcement Learning • Updated Jun 28, 2023

cleanrl/InvertedPendulum-v4-ddpg_continuous_action-seed1

Reinforcement Learning • Updated Jun 28, 2023

cleanrl/Pusher-v4-ddpg_continuous_action_jax-seed1

Reinforcement Learning • Updated Jun 28, 2023

cleanrl/Hopper-v4-ddpg_continuous_action-seed1

Reinforcement Learning • Updated Jun 28, 2023

cleanrl/Humanoid-v4-ddpg_continuous_action_jax-seed1

Reinforcement Learning • Updated Jun 28, 2023

cleanrl/InvertedPendulum-v4-ddpg_continuous_action_jax-seed1

Reinforcement Learning • Updated Jun 28, 2023

cleanrl/Walker2d-v4-ddpg_continuous_action-seed1

Reinforcement Learning • Updated Jun 28, 2023

cleanrl/Hopper-v4-ddpg_continuous_action_jax-seed1

Reinforcement Learning • Updated Jun 28, 2023

cleanrl/Walker2d-v4-ddpg_continuous_action_jax-seed1

Reinforcement Learning • Updated Jun 28, 2023

cleanrl/HalfCheetah-v4-ddpg_continuous_action-seed1

Reinforcement Learning • Updated Jun 28, 2023

cleanrl/HalfCheetah-v4-ddpg_continuous_action_jax-seed1

Reinforcement Learning • Updated Jun 28, 2023

cleanrl/Zaxxon-v5-cleanba_impala_envpool_impala_atari_wrapper_a0_l1_d4-seed2

Reinforcement Learning • Updated Mar 26, 2023

cleanrl/Zaxxon-v5-cleanba_impala_envpool_impala_atari_wrapper_a0_l1_d4-seed3

Reinforcement Learning • Updated Mar 26, 2023

cleanrl/Zaxxon-v5-cleanba_impala_envpool_impala_atari_wrapper_a0_l1_d4-seed1

Reinforcement Learning • Updated Mar 26, 2023