knight9114
/

rl_course_vizdoom_health_gathering_supreme

Reinforcement Learning

sample-factory

TensorBoard

deep-reinforcement-learning

Eval Results

Model card Files Files and versions Metrics Training metrics Community

knight9114 commited on Aug 16

Commit

22ca058

•

1 Parent(s): f87c44b

Upload config.json with huggingface_hub

Browse files

Files changed (1) hide show

config.json +32 -19

config.json CHANGED Viewed

@@ -6,7 +6,7 @@
   "train_dir": "/home/knight/github/huggingface-deep-rl-course/unit8/train_dir",
   "restart_behavior": "resume",
   "device": "gpu",
-  "seed": null,
   "num_policies": 1,
   "async_rl": true,
   "serial_mode": false,
@@ -17,7 +17,7 @@
   "max_policy_lag": 1000,
   "num_workers": 8,
   "num_envs_per_worker": 4,
-  "batch_size": 1024,
   "num_batches_per_epoch": 1,
   "num_epochs": 1,
   "rollout": 32,
@@ -42,7 +42,7 @@
   "adam_eps": 1e-06,
   "adam_beta1": 0.9,
   "adam_beta2": 0.999,
-  "max_grad_norm": 4.0,
   "learning_rate": 0.0001,
   "lr_schedule": "constant",
   "lr_schedule_kl_threshold": 0.008,
@@ -50,7 +50,7 @@
   "obs_scale": 255.0,
   "normalize_input": true,
   "normalize_input_keys": null,
-  "decorrelate_experience_max_seconds": 0,
   "decorrelate_envs_on_one_worker": true,
   "actor_worker_gpus": [],
   "set_workers_cpu_affinity": true,
@@ -61,10 +61,10 @@
   "flush_summaries_interval": 30,
   "stats_avg": 100,
   "summaries_use_frameskip": true,
-  "heartbeat_interval": 20,
-  "heartbeat_reporting_interval": 600,
-  "train_for_env_steps": 4000000,
-  "train_for_seconds": 10000000000,
   "save_every_sec": 120,
   "keep_checkpoints": 2,
   "load_checkpoint_kind": "latest",
@@ -83,10 +83,10 @@
   ],
   "use_rnn": true,
   "rnn_size": 512,
-  "rnn_type": "gru",
   "rnn_num_layers": 1,
   "decoder_mlp_layers": [],
-  "nonlinearity": "elu",
   "policy_initialization": "orthogonal",
   "policy_init_gain": 1.0,
   "actor_critic_share_weights": true,
@@ -95,7 +95,6 @@
   "initial_stddev": 1.0,
   "use_env_info_cache": false,
   "env_gpu_actions": false,
-  "env_gpu_observations": true,
   "env_frameskip": 4,
   "env_framestack": 1,
   "pixel_format": "CHW",
@@ -128,14 +127,28 @@
   "wide_aspect_ratio": false,
   "eval_env_frameskip": 1,
   "fps": 35,
-  "command_line": "--env=doom_health_gathering_supreme --num_workers=8 --num_envs_per_worker=4 --train_for_env_steps=4000000",
   "cli_args": {
     "env": "doom_health_gathering_supreme",
     "num_workers": 8,
-    "num_envs_per_worker": 4,
-    "train_for_env_steps": 4000000
-  },
-  "git_hash": "unknown",
-  "git_repo_name": "not a git repository",
-  "train_script": ".home.knight.github.huggingface-deep-rl-course.unit8.venv.lib.python3.10.site-packages.ipykernel_launcher"
-}

   "train_dir": "/home/knight/github/huggingface-deep-rl-course/unit8/train_dir",
   "restart_behavior": "resume",
   "device": "gpu",
+  "seed": 2222,
   "num_policies": 1,
   "async_rl": true,
   "serial_mode": false,
   "max_policy_lag": 1000,
   "num_workers": 8,
   "num_envs_per_worker": 4,
+  "batch_size": 2048,
   "num_batches_per_epoch": 1,
   "num_epochs": 1,
   "rollout": 32,
   "adam_eps": 1e-06,
   "adam_beta1": 0.9,
   "adam_beta2": 0.999,
+  "max_grad_norm": 0.0,
   "learning_rate": 0.0001,
   "lr_schedule": "constant",
   "lr_schedule_kl_threshold": 0.008,
   "obs_scale": 255.0,
   "normalize_input": true,
   "normalize_input_keys": null,
+  "decorrelate_experience_max_seconds": 1,
   "decorrelate_envs_on_one_worker": true,
   "actor_worker_gpus": [],
   "set_workers_cpu_affinity": true,
   "flush_summaries_interval": 30,
   "stats_avg": 100,
   "summaries_use_frameskip": true,
+  "heartbeat_interval": 10,
+  "heartbeat_reporting_interval": 300,
+  "train_for_env_steps": 10000000000,
+  "train_for_seconds": 3600000,
   "save_every_sec": 120,
   "keep_checkpoints": 2,
   "load_checkpoint_kind": "latest",
   ],
   "use_rnn": true,
   "rnn_size": 512,
+  "rnn_type": "lstm",
   "rnn_num_layers": 1,
   "decoder_mlp_layers": [],
+  "nonlinearity": "relu",
   "policy_initialization": "orthogonal",
   "policy_init_gain": 1.0,
   "actor_critic_share_weights": true,
   "initial_stddev": 1.0,
   "use_env_info_cache": false,
   "env_gpu_actions": false,
   "env_frameskip": 4,
   "env_framestack": 1,
   "pixel_format": "CHW",
   "wide_aspect_ratio": false,
   "eval_env_frameskip": 1,
   "fps": 35,
+  "command_line": "--train_for_seconds=3600000 --algo=APPO --gamma=0.99 --use_rnn=True --num_workers=8 --num_envs_per_worker=12 --num_epochs=1 --rollout=32 --recurrence=32 --batch_size=2048 --benchmark=False --max_grad_norm=0.0 --decorrelate_experience_max_seconds=1 --nonlinearity=relu --rnn_type=lstm --num_policies=1 --heartbeat_reporting_interval=300 --train_dir=/home/knight/github/huggingface-deep-rl-course/unit8/train_dir --seed=2222 --experiment=default_experiment --env=doom_health_gathering_supreme",
   "cli_args": {
+    "algo": "APPO",
     "env": "doom_health_gathering_supreme",
+    "experiment": "default_experiment",
+    "train_dir": "/home/knight/github/huggingface-deep-rl-course/unit8/train_dir",
+    "seed": 2222,
+    "num_policies": 1,
     "num_workers": 8,
+    "num_envs_per_worker": 12,
+    "batch_size": 2048,
+    "num_epochs": 1,
+    "rollout": 32,
+    "recurrence": 32,
+    "gamma": 0.99,
+    "max_grad_norm": 0.0,
+    "decorrelate_experience_max_seconds": 1,
+    "heartbeat_reporting_interval": 300,
+    "train_for_seconds": 3600000,
+    "benchmark": false,
+    "use_rnn": true,
+    "rnn_type": "lstm",
+    "nonlinearity": "relu"
+  }
+}