iantc104's picture
Upload YAML configuration
f8ab39c verified
resume: false
device: cuda
use_amp: false
seed: 1000
dataset_repo_id: iantc104/RPL-UR5-PegInsert-Mimic-v0
video_backend: pyav
training:
offline_steps: 50000
num_workers: 16
batch_size: 64
eval_freq: ???
log_freq: 100
save_checkpoint: true
save_freq: 10000
online_steps: ???
online_rollout_n_episodes: 1
online_rollout_batch_size: 1
online_steps_between_rollouts: 1
online_sampling_ratio: 0.5
online_env_seed: null
online_buffer_capacity: null
online_buffer_seed_size: 0
do_online_rollout_async: false
image_transforms:
enable: false
max_num_transforms: 3
random_order: false
brightness:
weight: 1
min_max:
- 0.8
- 1.2
contrast:
weight: 1
min_max:
- 0.8
- 1.2
saturation:
weight: 1
min_max:
- 0.5
- 1.5
hue:
weight: 1
min_max:
- -0.05
- 0.05
sharpness:
weight: 1
min_max:
- 0.8
- 1.2
lr: 1.0e-05
lr_backbone: 1.0e-05
weight_decay: 0.0001
grad_clip_norm: 10
delta_timestamps:
observation.environment_state:
- -0.9666666666666667
- -0.9333333333333333
- -0.9
- -0.8666666666666667
- -0.8333333333333334
- -0.8
- -0.7666666666666667
- -0.7333333333333333
- -0.7
- -0.6666666666666666
- -0.6333333333333333
- -0.6
- -0.5666666666666667
- -0.5333333333333333
- -0.5
- -0.4666666666666667
- -0.43333333333333335
- -0.4
- -0.36666666666666664
- -0.3333333333333333
- -0.3
- -0.26666666666666666
- -0.23333333333333334
- -0.2
- -0.16666666666666666
- -0.13333333333333333
- -0.1
- -0.06666666666666667
- -0.03333333333333333
- 0.0
observation.state:
- -0.9666666666666667
- -0.9333333333333333
- -0.9
- -0.8666666666666667
- -0.8333333333333334
- -0.8
- -0.7666666666666667
- -0.7333333333333333
- -0.7
- -0.6666666666666666
- -0.6333333333333333
- -0.6
- -0.5666666666666667
- -0.5333333333333333
- -0.5
- -0.4666666666666667
- -0.43333333333333335
- -0.4
- -0.36666666666666664
- -0.3333333333333333
- -0.3
- -0.26666666666666666
- -0.23333333333333334
- -0.2
- -0.16666666666666666
- -0.13333333333333333
- -0.1
- -0.06666666666666667
- -0.03333333333333333
- 0.0
eval:
n_episodes: 1
batch_size: 1
use_async_envs: false
wandb:
enable: true
disable_artifact: false
project: rpl_sim
notes: ''
fps: 30
env:
name: real_world
task: null
state_dim: 16
action_dim: 10
fps: ${fps}
policy:
name: rnd
n_obs_steps: 30
input_shapes:
observation.environment_state:
- 18
observation.state:
- 16
input_normalization_modes:
observation.environment_state: mean_std
observation.state: mean_std
predictor_dims: 256
n_predictor_layers: 4
predictor_activation: ReLU
dim_target: 256
n_target_layers: 3
target_activation: ReLU
dim_output: 256