Initial commit

Files changed (9) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 160.00 +/- 155.69
       name: mean_reward
       verified: false
 ---
@@ -63,16 +63,16 @@ python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f lo
 ## Hyperparameters
 ```python
-OrderedDict([('batch_size', 32),
-             ('buffer_size', 100000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_final_eps', 0.01),
              ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
-             ('learning_rate', 0.0001),
-             ('learning_starts', 100000),
              ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),

       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 195.00 +/- 73.18
       name: mean_reward
       verified: false
 ---
 ## Hyperparameters
 ```python
+OrderedDict([('batch_size', 64),
+             ('buffer_size', 500000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_final_eps', 0.01),
              ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
+             ('learning_rate', 0.00025),
+             ('learning_starts', 50000),
              ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),

args.yml CHANGED Viewed

@@ -20,7 +20,7 @@
   - - hyperparams
     - null
   - - log_folder
-    - logs/
   - - log_interval
     - -1
   - - max_total_trials
@@ -56,7 +56,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 913935887
   - - storage
     - null
   - - study_name

   - - hyperparams
     - null
   - - log_folder
+    - logs
   - - log_interval
     - -1
   - - max_total_trials
   - - save_replay_buffer
     - false
   - - seed
+    - 743556992
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -1,8 +1,8 @@
 !!python/object/apply:collections.OrderedDict
 - - - batch_size
-    - 32
   - - buffer_size
-    - 100000
   - - env_wrapper
     - - stable_baselines3.common.atari_wrappers.AtariWrapper
   - - exploration_final_eps
@@ -14,9 +14,9 @@
   - - gradient_steps
     - 1
   - - learning_rate
-    - 0.0001
   - - learning_starts
-    - 100000
   - - n_timesteps
     - 1000000.0
   - - optimize_memory_usage

 !!python/object/apply:collections.OrderedDict
 - - - batch_size
+    - 64
   - - buffer_size
+    - 500000
   - - env_wrapper
     - - stable_baselines3.common.atari_wrappers.AtariWrapper
   - - exploration_final_eps
   - - gradient_steps
     - 1
   - - learning_rate
+    - 0.00025
   - - learning_starts
+    - 50000
   - - n_timesteps
     - 1000000.0
   - - optimize_memory_usage

dqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c5fc9bd46a2209791062adc948efae296d6240e54057112929c793f3040696b8
-size 13712122

 version https://git-lfs.github.com/spec/v1
+oid sha256:ed35bc7a7cab91d4071ad04edae1fcef56b3b9b2ee7fc2583a782e22a84ca1f6
+size 27221023

dqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:215ea7d8898faa9284464c7109532cf36390d330fccab8d77eeba20628a32876
-size 1120

 version https://git-lfs.github.com/spec/v1
+oid sha256:815ef3bc8fddb110231d1189b38a9809ac7497b2269c660e34b4dea7c5722913
+size 13506172

dqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7c0019842e97b7124f224fea7cbcd97c71c8f3a8431655516feaa7cb4302ca27
 size 13505370

 version https://git-lfs.github.com/spec/v1
+oid sha256:1a49639c1937e17284bee37e6e9460988f5f2a62f576193305f5b26264bbf66c
 size 13505370

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~160~~.0, "std_reward": ~~155~~.~~6920036482285~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2025-01-~~18T13~~:46:39.~~448399~~"}


1	+ {"mean_reward": 195.0, "std_reward": 73.1778655059028, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2025-01-18T20:46:49.777933"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f9a95832da2e49328c92b562c36f2edbaca64c92029a36fb2efe619c7dabcbd1
-size 349

 version https://git-lfs.github.com/spec/v1
+oid sha256:7a52e9d799f78cf0a29b2f6d0a9dfb9bc5006b8d61e3a1dc3cbb1341fdc4ccca
+size 9518