resume: false device: cuda use_amp: false seed: 1000 dataset_repo_id: iantc104/RPL-UR5-PegInsert-Mimic-v0 video_backend: pyav training: offline_steps: 50000 num_workers: 16 batch_size: 64 eval_freq: ??? log_freq: 100 save_checkpoint: true save_freq: 10000 online_steps: ??? online_rollout_n_episodes: 1 online_rollout_batch_size: 1 online_steps_between_rollouts: 1 online_sampling_ratio: 0.5 online_env_seed: null online_buffer_capacity: null online_buffer_seed_size: 0 do_online_rollout_async: false image_transforms: enable: false max_num_transforms: 3 random_order: false brightness: weight: 1 min_max: - 0.8 - 1.2 contrast: weight: 1 min_max: - 0.8 - 1.2 saturation: weight: 1 min_max: - 0.5 - 1.5 hue: weight: 1 min_max: - -0.05 - 0.05 sharpness: weight: 1 min_max: - 0.8 - 1.2 lr: 1.0e-05 lr_backbone: 1.0e-05 weight_decay: 0.0001 grad_clip_norm: 10 delta_timestamps: observation.environment_state: - -0.9666666666666667 - -0.9333333333333333 - -0.9 - -0.8666666666666667 - -0.8333333333333334 - -0.8 - -0.7666666666666667 - -0.7333333333333333 - -0.7 - -0.6666666666666666 - -0.6333333333333333 - -0.6 - -0.5666666666666667 - -0.5333333333333333 - -0.5 - -0.4666666666666667 - -0.43333333333333335 - -0.4 - -0.36666666666666664 - -0.3333333333333333 - -0.3 - -0.26666666666666666 - -0.23333333333333334 - -0.2 - -0.16666666666666666 - -0.13333333333333333 - -0.1 - -0.06666666666666667 - -0.03333333333333333 - 0.0 observation.state: - -0.9666666666666667 - -0.9333333333333333 - -0.9 - -0.8666666666666667 - -0.8333333333333334 - -0.8 - -0.7666666666666667 - -0.7333333333333333 - -0.7 - -0.6666666666666666 - -0.6333333333333333 - -0.6 - -0.5666666666666667 - -0.5333333333333333 - -0.5 - -0.4666666666666667 - -0.43333333333333335 - -0.4 - -0.36666666666666664 - -0.3333333333333333 - -0.3 - -0.26666666666666666 - -0.23333333333333334 - -0.2 - -0.16666666666666666 - -0.13333333333333333 - -0.1 - -0.06666666666666667 - -0.03333333333333333 - 0.0 eval: n_episodes: 1 batch_size: 1 use_async_envs: false wandb: enable: true disable_artifact: false project: rpl_sim notes: '' fps: 30 env: name: real_world task: null state_dim: 16 action_dim: 10 fps: ${fps} policy: name: rnd n_obs_steps: 30 input_shapes: observation.environment_state: - 18 observation.state: - 16 input_normalization_modes: observation.environment_state: mean_std observation.state: mean_std predictor_dims: 256 n_predictor_layers: 4 predictor_activation: ReLU dim_target: 256 n_target_layers: 3 target_activation: ReLU dim_output: 256