cleanrl

non-profit

https://github.com/vwxyzjn/cleanrl

vwxyzjn

vwxyzjn

Activity Feed Request to join this org

AI & ML interests

None defined yet.

cleanrl 's models 1,217

cleanrl/Pusher-v4-ppo_continuous_action-seed1

Reinforcement Learning • Updated Oct 15, 2023

cleanrl/Humanoid-v4-ppo_continuous_action-seed1

Reinforcement Learning • Updated Oct 15, 2023 • 1

cleanrl/Ant-v4-ppo_continuous_action-seed1

Reinforcement Learning • Updated Oct 15, 2023

cleanrl/Swimmer-v4-ppo_continuous_action-seed1

Reinforcement Learning • Updated Oct 15, 2023

cleanrl/HalfCheetah-v4-ppo_continuous_action-seed1

Reinforcement Learning • Updated Oct 15, 2023

cleanrl/Hopper-v4-ppo_continuous_action-seed1

Reinforcement Learning • Updated Oct 15, 2023

cleanrl/Walker2d-v4-ppo_continuous_action-seed1

Reinforcement Learning • Updated Oct 15, 2023

cleanrl/Humanoid-v2-td3_continuous_action_jax-seed1

Reinforcement Learning • Updated Oct 12, 2023

cleanrl/Humanoid-v4-td3_continuous_action_jax-seed1

Reinforcement Learning • Updated Oct 12, 2023

cleanrl/Pusher-v2-td3_continuous_action_jax-seed1

Reinforcement Learning • Updated Oct 12, 2023

cleanrl/Pusher-v4-td3_continuous_action_jax-seed1

Reinforcement Learning • Updated Oct 12, 2023

cleanrl/InvertedPendulum-v2-td3_continuous_action_jax-seed1

Reinforcement Learning • Updated Oct 12, 2023

cleanrl/InvertedPendulum-v4-td3_continuous_action_jax-seed1

Reinforcement Learning • Updated Oct 12, 2023

cleanrl/Hopper-v2-td3_continuous_action_jax-seed1

Reinforcement Learning • Updated Oct 12, 2023

cleanrl/Hopper-v4-td3_continuous_action_jax-seed1

Reinforcement Learning • Updated Oct 12, 2023

cleanrl/Walker2d-v2-td3_continuous_action_jax-seed1

Reinforcement Learning • Updated Oct 12, 2023

cleanrl/Walker2d-v4-td3_continuous_action_jax-seed1

Reinforcement Learning • Updated Oct 12, 2023

cleanrl/HalfCheetah-v2-td3_continuous_action_jax-seed1

Reinforcement Learning • Updated Oct 12, 2023

cleanrl/HalfCheetah-v4-td3_continuous_action_jax-seed1

Reinforcement Learning • Updated Oct 12, 2023

cleanrl/Pusher-v2-td3_continuous_action-seed1

Reinforcement Learning • Updated Oct 11, 2023

cleanrl/Pusher-v4-td3_continuous_action-seed1

Reinforcement Learning • Updated Oct 11, 2023

cleanrl/Humanoid-v2-td3_continuous_action-seed1

Reinforcement Learning • Updated Oct 11, 2023

cleanrl/Humanoid-v4-td3_continuous_action-seed1

Reinforcement Learning • Updated Oct 11, 2023

cleanrl/InvertedPendulum-v2-td3_continuous_action-seed1

Reinforcement Learning • Updated Oct 11, 2023

cleanrl/InvertedPendulum-v4-td3_continuous_action-seed1

Reinforcement Learning • Updated Oct 11, 2023

cleanrl/Hopper-v2-td3_continuous_action-seed1

Reinforcement Learning • Updated Oct 11, 2023

cleanrl/Hopper-v4-td3_continuous_action-seed1

Reinforcement Learning • Updated Oct 11, 2023

cleanrl/Walker2d-v2-td3_continuous_action-seed1

Reinforcement Learning • Updated Oct 11, 2023

cleanrl/Walker2d-v4-td3_continuous_action-seed1

Reinforcement Learning • Updated Oct 11, 2023

cleanrl/HalfCheetah-v2-td3_continuous_action-seed1

Reinforcement Learning • Updated Oct 11, 2023