Edit Models filters

Tasks

Text Generation

Image-Text-to-Text

Parameters

Libraries

Transformers.js

Apps

Inference Providers

Models

971

Full-text search

Active filters: reinforcement-learning, transformers

davidgaofc/PPO_base

Reinforcement Learning • Updated Nov 24, 2023 • 9

davidgaofc/PPO_prima

Reinforcement Learning • Updated Nov 25, 2023 • 37

kieranbm/ppo-LunarLander-v2

Reinforcement Learning • Updated Feb 6, 2024 • 7

lorenzreyes/ppo-LunarLander-v2

Reinforcement Learning • Updated Dec 27, 2023 • 9

ybelkada/test-ppo-tag

Reinforcement Learning • Updated Dec 25, 2023 • 38

MadFritz/ars-BipedalWalker-v3

Reinforcement Learning • Updated Jan 14, 2024 • 9

aumy/ppo-LunarLander-v2

Reinforcement Learning • Updated Jun 12, 2024 • 23

bnurpek/gpt2-256T-neg-0

Reinforcement Learning • Updated Jan 2, 2024 • 30

bnurpek/gpt2-256T-neg-1

Reinforcement Learning • Updated Jan 2, 2024 • 15

bnurpek/gpt2-256T-neg-2

Reinforcement Learning • Updated Jan 2, 2024 • 76

bnurpek/gpt2-256T-neg-3

Reinforcement Learning • Updated Jan 2, 2024 • 33

bnurpek/gpt2-256T-neg-5

Reinforcement Learning • Updated Jan 2, 2024 • 18

bnurpek/gpt2-256T-neg-7

Reinforcement Learning • Updated Jan 2, 2024 • 15

bnurpek/gpt2-256T-neg-10

Reinforcement Learning • Updated Jan 2, 2024 • 16

bnurpek/gpt2-256T-neg-15

Reinforcement Learning • Updated Jan 2, 2024 • 16

bnurpek/gpt2-256T-neg-20

Reinforcement Learning • Updated Jan 2, 2024 • 17

bnurpek/gpt2-256T-neg-30

Reinforcement Learning • Updated Jan 2, 2024 • 12

bnurpek/gpt2-256T-neg-50

Reinforcement Learning • Updated Jan 2, 2024 • 52

bnurpek/gpt2-256T-neg-70

Reinforcement Learning • Updated Jan 2, 2024 • 11

bnurpek/gpt2-256T-neg-100

Reinforcement Learning • Updated Jan 2, 2024 • 11

bnurpek/try2-gpt2-256T-neg-0

Reinforcement Learning • Updated Jan 2, 2024 • 15

bnurpek/try2-gpt2-256T-neg-1

Reinforcement Learning • Updated Jan 2, 2024 • 56

bnurpek/try2-gpt2-256T-neg-2

Reinforcement Learning • Updated Jan 2, 2024 • 10

bnurpek/try2-gpt2-256T-neg-3

Reinforcement Learning • Updated Jan 2, 2024 • 16

bnurpek/try2-gpt2-256T-neg-5

Reinforcement Learning • Updated Jan 2, 2024 • 17

bnurpek/try2-gpt2-256T-neg-7

Reinforcement Learning • Updated Jan 2, 2024 • 82

bnurpek/try2-gpt2-256T-neg-10

Reinforcement Learning • Updated Jan 2, 2024 • 11

bnurpek/try2-gpt2-256T-neg-15

Reinforcement Learning • Updated Jan 2, 2024 • 20

bnurpek/try2-gpt2-256T-neg-20

Reinforcement Learning • Updated Jan 2, 2024 • 15

bnurpek/try2-gpt2-256T-neg-30

Reinforcement Learning • Updated Jan 2, 2024 • 16