Edit Models filters

Tasks

Text Generation

Image-Text-to-Text

Parameters

Libraries

Transformers.js

Apps

Inference Providers

Models

970

Full-text search

Active filters: reinforcement-learning, transformers

eugene-d/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 30, 2023 • 14

dotunadegbite/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 25, 2023 • 34

asuzuki/PPO-LunarLander-v2

Reinforcement Learning • Updated Mar 22, 2023 • 89

akanametov/decision-transformer-HalfCheetah-v3

Reinforcement Learning • Updated Jan 10, 2023 • 23

vicfeuga/ppo-LunarLander-v2

Reinforcement Learning • Updated Dec 2, 2023 • 17

habanoz/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 26, 2023 • 14

FabioDataGeek/ppo-LunarLander-v2

Reinforcement Learning • Updated May 2, 2023 • 12

mkahari/RL_testing

Reinforcement Learning • Updated Jan 11, 2023 • 11

arenbeglaryan/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 8, 2023 • 11

MHaurel/ppo-LunarLander-v2

Reinforcement Learning • Updated May 30, 2023 • 11

akoshel/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 27, 2023 • 37

rootacess/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 5, 2023 • 13

morganjeffries/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 19, 2023 • 14

jrnold/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 1, 2023 • 14

lewtun/dummy-trl-model

Reinforcement Learning • Updated Jan 24, 2023 • 20 • 1

stinoco/PPO-LunarLander-v2

Reinforcement Learning • Updated Mar 6, 2023 • 13

mili7522/ppo-cleanrl-LunarLander-v2

Reinforcement Learning • Updated Apr 16, 2023 • 28

EdenYav/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 22, 2023 • 52

victorivus/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 3, 2023 • 19

slopezay/ppo-LunarLander-v2

Reinforcement Learning • Updated May 20, 2023 • 14

nikogarro/PPO-LunarLander-v2

Reinforcement Learning • Updated Feb 16, 2023 • 14

jamesthong/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 26, 2023 • 11

ybelkada/gpt-neo-125m-detox

Reinforcement Learning • Updated Feb 17, 2023 • 533

ybelkada/gpt-neo-125m-detoxified-long-context

Reinforcement Learning • Updated Feb 17, 2023 • 26

dungtd2403/CartPole-v1

Reinforcement Learning • Updated Mar 5, 2023 • 11

ZhihongDeng/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 30, 2023 • 30

mkuntz/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 26, 2023 • 17

Gabcsor/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 13, 2023 • 15

dcduplooy/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 15, 2023 • 11

Yureeh/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 6, 2023 • 14