Initial commit

Files changed (9) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 361.00 +/- 162.29
       name: mean_reward
       verified: false
 ---
@@ -64,7 +64,7 @@ python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f lo
 ## Hyperparameters
 ```python
 OrderedDict([('batch_size', 128),
-             ('buffer_size', 300000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_final_eps', 0.01),
@@ -72,12 +72,12 @@ OrderedDict([('batch_size', 128),
              ('frame_stack', 4),
              ('gradient_steps', 1),
              ('learning_rate', 0.00025),
-             ('learning_starts', 50000),
              ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),
-             ('train_freq', 4),
              ('normalize', False)])
 ```

       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 666.00 +/- 267.61
       name: mean_reward
       verified: false
 ---
 ## Hyperparameters
 ```python
 OrderedDict([('batch_size', 128),
+             ('buffer_size', 500000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_final_eps', 0.01),
              ('frame_stack', 4),
              ('gradient_steps', 1),
              ('learning_rate', 0.00025),
+             ('learning_starts', 100000),
              ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),
+             ('train_freq', 8),
              ('normalize', False)])
 ```

args.yml CHANGED Viewed

@@ -56,7 +56,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 4132879894
   - - storage
     - null
   - - study_name

   - - save_replay_buffer
     - false
   - - seed
+    - 3478458756
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -2,7 +2,7 @@
 - - - batch_size
     - 128
   - - buffer_size
-    - 300000
   - - env_wrapper
     - - stable_baselines3.common.atari_wrappers.AtariWrapper
   - - exploration_final_eps
@@ -16,7 +16,7 @@
   - - learning_rate
     - 0.00025
   - - learning_starts
-    - 50000
   - - n_timesteps
     - 1000000.0
   - - optimize_memory_usage
@@ -26,4 +26,4 @@
   - - target_update_interval
     - 1000
   - - train_freq
-    - 4

 - - - batch_size
     - 128
   - - buffer_size
+    - 500000
   - - env_wrapper
     - - stable_baselines3.common.atari_wrappers.AtariWrapper
   - - exploration_final_eps
   - - learning_rate
     - 0.00025
   - - learning_starts
+    - 100000
   - - n_timesteps
     - 1000000.0
   - - optimize_memory_usage
   - - target_update_interval
     - 1000
   - - train_freq
+    - 8

dqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:86f960bb0651a207527fd8dd558c589238295601434ec7fbb73147ce9ec0537e
-size 27221024

 version https://git-lfs.github.com/spec/v1
+oid sha256:871f15a826c221989f9fffbb32266b7a26f48f901beff9dc309abef44cc7d52d
+size 27221026

dqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e9d391aaad9d50fcc792655841b027bf03b4427da37e6d272ba167d6bb70172b
 size 13506172

 version https://git-lfs.github.com/spec/v1
+oid sha256:28df8eaaa722014d4e4d0f98df3698440ca567cc09ebde4ab31dfcd1ef0df3fa
 size 13506172

dqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c28b4060bbb35a8739d64510d279933f4b61a75c850bccb136207d7a40bce3e4
 size 13505370

 version https://git-lfs.github.com/spec/v1
+oid sha256:23bead6a79e0ca3b752e95d3ab43f9eb6f3c24ccfbf51477b3d7230417e810d8
 size 13505370

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~361~~.0, "std_reward": ~~162~~.~~29294500994183~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2025-01-~~18T21~~:48:19.~~130994~~"}


1	+ {"mean_reward": 666.0, "std_reward": 267.6079221547823, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2025-01-19T13:52:52.192576"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a1cd5b9c9f6639f9afe88dde5e3c3702cd396a30de0d9756a90e16307847eeb6
-size 9428

 version https://git-lfs.github.com/spec/v1
+oid sha256:6c43a9a1e8398f523b54751a8c62c6838e37c255481921cb4bf4d2c106eabe89
+size 29122