RL nav policies

Files changed (3) hide show

rl/prepare_groceries/navigate/all/config.yml +102 -0
rl/prepare_groceries/navigate/all/policy.pt +3 -0
rl/set_table/navigate/all/policy.pt +1 -1

rl/prepare_groceries/navigate/all/config.yml ADDED Viewed

	@@ -0,0 +1,102 @@

+seed: 2337
+env:
+  env_id: NavigateSubtaskTrain-v0
+  num_envs: 189
+  max_episode_steps: 1000
+  make_env: true
+  obs_mode: depth
+  render_mode: all
+  shader_dir: minimal
+  sim_backend: gpu
+  continuous_task: false
+  cat_state: true
+  cat_pixels: false
+  frame_stack: 3
+  stack: null
+  stationary_base: false
+  stationary_torso: false
+  stationary_head: true
+  task_plan_fp: ~/.maniskill/data/scene_datasets/replica_cad_dataset/rearrange/task_plans/prepare_groceries/navigate/train/all.json
+  spawn_data_fp: ~/.maniskill/data/scene_datasets/replica_cad_dataset/rearrange/spawn_data/prepare_groceries/navigate/train/spawn_data.pt
+  record_video: false
+  debug_video: false
+  debug_video_gen: false
+  save_video_freq: null
+  info_on_video: false
+  extra_stat_keys: []
+  env_kwargs:
+    robot_force_mult: 0.001
+    robot_force_penalty_min: 0.2
+    target_randomization: false
+    task_cfgs:
+      navigate:
+        horizon: 1000
+    use_rot_rew: false
+eval_env:
+  env_id: NavigateSubtaskTrain-v0
+  num_envs: 63
+  max_episode_steps: 1000
+  make_env: true
+  obs_mode: depth
+  render_mode: all
+  shader_dir: minimal
+  sim_backend: gpu
+  continuous_task: false
+  cat_state: true
+  cat_pixels: false
+  frame_stack: 3
+  stack: null
+  stationary_base: false
+  stationary_torso: false
+  stationary_head: true
+  task_plan_fp: ~/.maniskill/data/scene_datasets/replica_cad_dataset/rearrange/task_plans/prepare_groceries/navigate/train/all.json
+  spawn_data_fp: ~/.maniskill/data/scene_datasets/replica_cad_dataset/rearrange/spawn_data/prepare_groceries/navigate/train/spawn_data.pt
+  record_video: false
+  debug_video: false
+  debug_video_gen: false
+  save_video_freq: 10
+  info_on_video: false
+  extra_stat_keys: []
+  env_kwargs:
+    robot_force_mult: 0.001
+    robot_force_penalty_min: 0.2
+    target_randomization: false
+    task_cfgs:
+      navigate:
+        horizon: 1000
+    use_rot_rew: false
+algo:
+  name: ppo
+  total_timesteps: 1000000000
+  learning_rate: 0.0003
+  anneal_lr: false
+  gamma: 0.95
+  gae_lambda: 0.9
+  num_minibatches: 16
+  update_epochs: 8
+  norm_adv: true
+  clip_coef: 0.2
+  clip_vloss: false
+  ent_coef: 0.0
+  vf_coef: 0.5
+  max_grad_norm: 0.5
+  target_kl: 0.2
+  log_freq: 250000
+  save_freq: 250000
+  eval_freq: null
+  finite_horizon_gae: true
+  torch_deterministic: true
+  save_backup_ckpts: false
+  num_steps: 100
+  num_envs: 189
+  num_eval_envs: 63
+  batch_size: 18900
+  minibatch_size: 1181
+  num_iterations: 52911
+logger:
+  workspace: mshab_exps
+  exp_name: rcad-prepare_groceries-navigate-all
+  clear_out: true
+  tensorboard: true
+  wandb: false
+model_ckpt: "mshab_checkpoints/rl/prepare_groceries/navigate/all/policy.pt"

rl/prepare_groceries/navigate/all/policy.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:957da18169588d9d7a8b630418d1c5b5a448273c1dcec0ec01daebb650a680ce
+size 68156042

rl/set_table/navigate/all/policy.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84c8ee51cb27d595f4c318b8c56544a17a79aaf0b4d00bbe43635192f5f40c77
 size 68156042

 version https://git-lfs.github.com/spec/v1
+oid sha256:5c31c4a1d16daff9e5ce6eff0760f02da5383ffa242d1e97141261e080cf8e2a
 size 68156042