mpgussert
diff --git a/‎scripts/reinforcement_learning/skrl/play.py‎
Lines changed: 1 addition & 0 deletions b/‎scripts/reinforcement_learning/skrl/play.py‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎scripts/reinforcement_learning/skrl/train.py‎
Lines changed: 1 addition & 0 deletions b/‎scripts/reinforcement_learning/skrl/train.py‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎source/isaaclab_tasks/isaaclab_tasks/direct/allegro_hand/agents/skrl_ppo_cfg.yaml‎
Lines changed: 2 additions & 2 deletions b/‎source/isaaclab_tasks/isaaclab_tasks/direct/allegro_hand/agents/skrl_ppo_cfg.yaml‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎source/isaaclab_tasks/isaaclab_tasks/direct/ant/agents/skrl_ppo_cfg.yaml‎
Lines changed: 2 additions & 2 deletions b/‎source/isaaclab_tasks/isaaclab_tasks/direct/ant/agents/skrl_ppo_cfg.yaml‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎source/isaaclab_tasks/isaaclab_tasks/direct/anymal_c/agents/skrl_flat_ppo_cfg.yaml‎
Lines changed: 2 additions & 2 deletions b/‎source/isaaclab_tasks/isaaclab_tasks/direct/anymal_c/agents/skrl_flat_ppo_cfg.yaml‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎source/isaaclab_tasks/isaaclab_tasks/direct/anymal_c/agents/skrl_rough_ppo_cfg.yaml‎
Lines changed: 2 additions & 2 deletions b/‎source/isaaclab_tasks/isaaclab_tasks/direct/anymal_c/agents/skrl_rough_ppo_cfg.yaml‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎source/isaaclab_tasks/isaaclab_tasks/direct/cart_double_pendulum/agents/skrl_ippo_cfg.yaml‎
Lines changed: 2 additions & 2 deletions b/‎source/isaaclab_tasks/isaaclab_tasks/direct/cart_double_pendulum/agents/skrl_ippo_cfg.yaml‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎source/isaaclab_tasks/isaaclab_tasks/direct/cart_double_pendulum/agents/skrl_mappo_cfg.yaml‎
Lines changed: 2 additions & 2 deletions b/‎source/isaaclab_tasks/isaaclab_tasks/direct/cart_double_pendulum/agents/skrl_mappo_cfg.yaml‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎source/isaaclab_tasks/isaaclab_tasks/direct/cart_double_pendulum/agents/skrl_ppo_cfg.yaml‎
Lines changed: 2 additions & 2 deletions b/‎source/isaaclab_tasks/isaaclab_tasks/direct/cart_double_pendulum/agents/skrl_ppo_cfg.yaml‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎source/isaaclab_tasks/isaaclab_tasks/direct/cartpole/agents/skrl_camera_ppo_cfg.yaml‎
Lines changed: 2 additions & 2 deletions b/‎source/isaaclab_tasks/isaaclab_tasks/direct/cartpole/agents/skrl_camera_ppo_cfg.yaml‎
Lines changed: 2 additions & 2 deletions
@@ -121,6 +121,7 @@
     agent_cfg_entry_point = "skrl_cfg_entry_point" if algorithm in ["ppo"] else f"skrl_{algorithm}_cfg_entry_point"
 else:
     agent_cfg_entry_point = args_cli.agent
+    algorithm = agent_cfg_entry_point.split("_cfg")[0].split("skrl_")[-1].lower()
 
 
 @hydra_task_config(args_cli.task, agent_cfg_entry_point)
 
@@ -119,6 +119,7 @@
     agent_cfg_entry_point = "skrl_cfg_entry_point" if algorithm in ["ppo"] else f"skrl_{algorithm}_cfg_entry_point"
 else:
     agent_cfg_entry_point = args_cli.agent
+    algorithm = agent_cfg_entry_point.split("_cfg")[0].split("skrl_")[-1].lower()
 
 
 @hydra_task_config(args_cli.task, agent_cfg_entry_point)
 
@@ -19,7 +19,7 @@ models:
     initial_log_std: 0.0
     network:
       - name: net
-        input: STATES
+        input: OBSERVATIONS
         layers: [1024, 512, 256, 128]
         activations: elu
     output: ACTIONS
@@ -28,7 +28,7 @@ models:
     clip_actions: False
     network:
       - name: net
-        input: STATES
+        input: OBSERVATIONS
         layers: [1024, 512, 256, 128]
         activations: elu
     output: ONE
 
@@ -19,7 +19,7 @@ models:
     initial_log_std: 0.0
     network:
       - name: net
-        input: STATES
+        input: OBSERVATIONS
         layers: [256, 128, 64]
         activations: elu
     output: ACTIONS
@@ -28,7 +28,7 @@ models:
     clip_actions: False
     network:
       - name: net
-        input: STATES
+        input: OBSERVATIONS
         layers: [256, 128, 64]
         activations: elu
     output: ONE
 
@@ -19,7 +19,7 @@ models:
     initial_log_std: 0.0
     network:
       - name: net
-        input: STATES
+        input: OBSERVATIONS
         layers: [128, 128, 128]
         activations: elu
     output: ACTIONS
@@ -28,7 +28,7 @@ models:
     clip_actions: False
     network:
       - name: net
-        input: STATES
+        input: OBSERVATIONS
         layers: [128, 128, 128]
         activations: elu
     output: ONE
 
@@ -19,7 +19,7 @@ models:
     initial_log_std: 0.0
     network:
       - name: net
-        input: STATES
+        input: OBSERVATIONS
         layers: [512, 256, 128]
         activations: elu
     output: ACTIONS
@@ -28,7 +28,7 @@ models:
     clip_actions: False
     network:
       - name: net
-        input: STATES
+        input: OBSERVATIONS
         layers: [512, 256, 128]
         activations: elu
     output: ONE
 
@@ -19,7 +19,7 @@ models:
     initial_log_std: 0.0
     network:
       - name: net
-        input: STATES
+        input: OBSERVATIONS
         layers: [32, 32]
         activations: elu
     output: ACTIONS
@@ -28,7 +28,7 @@ models:
     clip_actions: False
     network:
       - name: net
-        input: STATES
+        input: OBSERVATIONS
         layers: [32, 32]
         activations: elu
     output: ONE
 
@@ -19,7 +19,7 @@ models:
     initial_log_std: 0.0
     network:
       - name: net
-        input: STATES
+        input: OBSERVATIONS
         layers: [32, 32]
         activations: elu
     output: ACTIONS
@@ -28,7 +28,7 @@ models:
     clip_actions: False
     network:
       - name: net
-        input: STATES
+        input: OBSERVATIONS
         layers: [32, 32]
         activations: elu
     output: ONE
 
@@ -19,7 +19,7 @@ models:
     initial_log_std: 0.0
     network:
       - name: net
-        input: STATES
+        input: OBSERVATIONS
         layers: [32, 32]
         activations: elu
     output: ACTIONS
@@ -28,7 +28,7 @@ models:
     clip_actions: False
     network:
       - name: net
-        input: STATES
+        input: OBSERVATIONS
         layers: [32, 32]
         activations: elu
     output: ONE
 
@@ -19,7 +19,7 @@ models:
     initial_log_std: 0.0
     network:
       - name: features_extractor
-        input: permute(STATES, (0, 3, 1, 2))  # PyTorch NHWC -> NCHW. Warning: don't permute for JAX since it expects NHWC
+        input: permute(OBSERVATIONS, (0, 3, 1, 2))  # PyTorch NHWC -> NCHW. Warning: don't permute for JAX since it expects NHWC
         layers:
           - conv2d: {out_channels: 32, kernel_size: 8, stride: 4, padding: 0}
           - conv2d: {out_channels: 64, kernel_size: 4, stride: 2, padding: 0}
@@ -36,7 +36,7 @@ models:
     clip_actions: False
     network:
       - name: features_extractor
-        input: permute(STATES, (0, 3, 1, 2))  # PyTorch NHWC -> NCHW. Warning: don't permute for JAX since it expects NHWC
+        input: permute(OBSERVATIONS, (0, 3, 1, 2))  # PyTorch NHWC -> NCHW. Warning: don't permute for JAX since it expects NHWC
         layers:
           - conv2d: {out_channels: 32, kernel_size: 8, stride: 4, padding: 0}
           - conv2d: {out_channels: 64, kernel_size: 4, stride: 2, padding: 0}