Initial commit

Files changed (10) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: ALE/MsPacman-v5
     metrics:
     - type: mean_reward
-      value: 600.00 +/- 273.20
       name: mean_reward
       verified: false
 ---
@@ -67,7 +67,7 @@ OrderedDict([('batch_size', 256),
              ('n_envs', 8),
              ('n_epochs', 4),
              ('n_steps', 128),
-             ('n_timesteps', 100000.0),
              ('policy', 'CnnPolicy'),
              ('vf_coef', 0.5),
              ('normalize', False)])

       type: ALE/MsPacman-v5
     metrics:
     - type: mean_reward
+      value: 2934.00 +/- 982.27
       name: mean_reward
       verified: false
 ---
              ('n_envs', 8),
              ('n_epochs', 4),
              ('n_steps', 128),
+             ('n_timesteps', 10000000.0),
              ('policy', 'CnnPolicy'),
              ('vf_coef', 0.5),
              ('normalize', False)])

args.yml CHANGED Viewed

@@ -52,7 +52,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 1957088056
   - - storage
     - null
   - - study_name

   - - save_replay_buffer
     - false
   - - seed
+    - 3847139588
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -18,7 +18,7 @@
   - - n_steps
     - 128
   - - n_timesteps
-    - 100000.0
   - - policy
     - CnnPolicy
   - - vf_coef

   - - n_steps
     - 128
   - - n_timesteps
+    - 10000000.0
   - - policy
     - CnnPolicy
   - - vf_coef

ppo-ALE-MsPacman-v5.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:963460d73a3808a1b9392f215084a36475dc2c64f8a9a0956dbc06ac0e04bbd6
-size 20460412

 version https://git-lfs.github.com/spec/v1
+oid sha256:af3c9be26583b22b3682f07c044f08d11024aade7dfa19bfd8e9c3764343d275
+size 20460599

ppo-ALE-MsPacman-v5/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

ppo-ALE-MsPacman-v5/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:aaa38a624806115921bb6154e31ccc602cfbe7f24edb044dbae96ccb2de8e425
 size 13523769

 version https://git-lfs.github.com/spec/v1
+oid sha256:0776ae089950e1967fe59ce0e0df9dcca0a97dd3b4ef5e0c933fb80fff156a9d
 size 13523769

ppo-ALE-MsPacman-v5/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:24363ec453853613689e8bb58d407a45e6ee6060d7d40c163eab1e44ec0f27a4
 size 6761153

 version https://git-lfs.github.com/spec/v1
+oid sha256:5854ce54273331fe3981626bd3446465404e3448af63749f9d6d2ee380cbcdc4
 size 6761153

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b813f1446d56d84b233e9d30f53c234a4b05a5a2879b84fcdcab874617638fb7
-size 296608

 version https://git-lfs.github.com/spec/v1
+oid sha256:b30a860ad7b7368be8a2c905ecfb22e161174034d4f112228f96f47d6242fd7c
+size 359088

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~600~~.0, "std_reward": ~~273~~.~~20322106446696~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2022-11-~~24T00~~:53:39.~~799849~~"}


1	+ {"mean_reward": 2934.0, "std_reward": 982.274910602933, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2022-11-24T11:46:59.324591"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d66542c2255a2b66e4d269824d379a050be792598cbbfa340af33cb0537944a5
-size 17914

 version https://git-lfs.github.com/spec/v1
+oid sha256:95e309f194c14d1447cb834567cb679c6b14054c54bddb0c0a1ed4540b8276a6
+size 961512