resume: false | |
device: cuda | |
use_amp: false | |
seed: 1000 | |
dataset_repo_id: iantc104/RPL-UR5-PegInsert-Mimic-v0 | |
video_backend: pyav | |
training: | |
offline_steps: 50000 | |
num_workers: 16 | |
batch_size: 64 | |
eval_freq: ??? | |
log_freq: 100 | |
save_checkpoint: true | |
save_freq: 10000 | |
online_steps: ??? | |
online_rollout_n_episodes: 1 | |
online_rollout_batch_size: 1 | |
online_steps_between_rollouts: 1 | |
online_sampling_ratio: 0.5 | |
online_env_seed: null | |
online_buffer_capacity: null | |
online_buffer_seed_size: 0 | |
do_online_rollout_async: false | |
image_transforms: | |
enable: false | |
max_num_transforms: 3 | |
random_order: false | |
brightness: | |
weight: 1 | |
min_max: | |
- 0.8 | |
- 1.2 | |
contrast: | |
weight: 1 | |
min_max: | |
- 0.8 | |
- 1.2 | |
saturation: | |
weight: 1 | |
min_max: | |
- 0.5 | |
- 1.5 | |
hue: | |
weight: 1 | |
min_max: | |
- -0.05 | |
- 0.05 | |
sharpness: | |
weight: 1 | |
min_max: | |
- 0.8 | |
- 1.2 | |
lr: 1.0e-05 | |
lr_backbone: 1.0e-05 | |
weight_decay: 0.0001 | |
grad_clip_norm: 10 | |
delta_timestamps: | |
observation.environment_state: | |
- -0.9666666666666667 | |
- -0.9333333333333333 | |
- -0.9 | |
- -0.8666666666666667 | |
- -0.8333333333333334 | |
- -0.8 | |
- -0.7666666666666667 | |
- -0.7333333333333333 | |
- -0.7 | |
- -0.6666666666666666 | |
- -0.6333333333333333 | |
- -0.6 | |
- -0.5666666666666667 | |
- -0.5333333333333333 | |
- -0.5 | |
- -0.4666666666666667 | |
- -0.43333333333333335 | |
- -0.4 | |
- -0.36666666666666664 | |
- -0.3333333333333333 | |
- -0.3 | |
- -0.26666666666666666 | |
- -0.23333333333333334 | |
- -0.2 | |
- -0.16666666666666666 | |
- -0.13333333333333333 | |
- -0.1 | |
- -0.06666666666666667 | |
- -0.03333333333333333 | |
- 0.0 | |
observation.state: | |
- -0.9666666666666667 | |
- -0.9333333333333333 | |
- -0.9 | |
- -0.8666666666666667 | |
- -0.8333333333333334 | |
- -0.8 | |
- -0.7666666666666667 | |
- -0.7333333333333333 | |
- -0.7 | |
- -0.6666666666666666 | |
- -0.6333333333333333 | |
- -0.6 | |
- -0.5666666666666667 | |
- -0.5333333333333333 | |
- -0.5 | |
- -0.4666666666666667 | |
- -0.43333333333333335 | |
- -0.4 | |
- -0.36666666666666664 | |
- -0.3333333333333333 | |
- -0.3 | |
- -0.26666666666666666 | |
- -0.23333333333333334 | |
- -0.2 | |
- -0.16666666666666666 | |
- -0.13333333333333333 | |
- -0.1 | |
- -0.06666666666666667 | |
- -0.03333333333333333 | |
- 0.0 | |
eval: | |
n_episodes: 1 | |
batch_size: 1 | |
use_async_envs: false | |
wandb: | |
enable: true | |
disable_artifact: false | |
project: rpl_sim | |
notes: '' | |
fps: 30 | |
env: | |
name: real_world | |
task: null | |
state_dim: 16 | |
action_dim: 10 | |
fps: ${fps} | |
policy: | |
name: rnd | |
n_obs_steps: 30 | |
input_shapes: | |
observation.environment_state: | |
- 18 | |
observation.state: | |
- 16 | |
input_normalization_modes: | |
observation.environment_state: mean_std | |
observation.state: mean_std | |
predictor_dims: 256 | |
n_predictor_layers: 4 | |
predictor_activation: ReLU | |
dim_target: 256 | |
n_target_layers: 3 | |
target_activation: ReLU | |
dim_output: 256 | |